The Perl Toolchain Summit needs more sponsors. If your company depends on Perl, please support this very important event.

NAME

whyfields(ja) -- or Modern use of fields.pm and %FIELDS.

DESCRIPTION

Modern Perl では、 perl で OOP 開発をする場合には Moose を使うよう 勧めて います。ですが、 yatt_lite は懐かしの fields を活用して書かれています。 ここでそのこだわりの理由を解説します。

(なお、ここでは読み易さのために perl5.14 以後の package Name {...} 構文を用います。古い perl で 試す場合は {package Name; ...} へと書き換えて下さい)

fields.pm -- old story.

fields は、 use strict のスペルミス検査を オブジェクトメンバーへの参照/代入にも適用可能にするためのものです。

    use strict;
    use 5.014; # For "package Name {block} syntax"
    package Cat {
       use fields qw/name birth_year/; # メンバー宣言
       sub new {
          my Cat $self = fields::new(shift); # 型注記付き my
          $self->{name}       = shift; # Checked!
          $self->{birth_year} = shift  # Checked!
             // $self->_this_year;
          $self;
       }
       sub age {
          my Cat $self = shift;
          return $self->_this_year
                    - $self->{birth_year}; # Checked!
       }
       sub _this_year {
          (localtime)[5] + 1900;
       }
    };

    my @cats = map {Cat->new($_, 2010)} qw/Tuxie Petunia Daisy/;

    foreach my Cat $cat (@cats) {
       print $cat->{name}, ": ", $cat->age, "\n";
       # print $cat->{namae}, "\n"; # コンパイルエラー!
    }

このプログラムではクラス Cat にメンバー {name} , {birth_year} を宣言しています。 ですので、 Cat を格納すると注記した変数 $self, $cat でメンバー名を間違えても、 コンパイル時に エラーを検出することが出来ます。 (unit test を書くまでもなく、です。もし vim の perl mode や yatt-lint-any-mode のような、 ファイル保存と同時に perl -wc 検査 を行う仕組を使っていれば、 間違いに即座に気付けるでしょう)

Why most people do not use fields.pm?

use strict の重要性は perl コミュニティに広く知れ渡っています。 なら fields の利用も広がってよさそうなのに、なぜ滅多に使われないのでしょう?

それには幾つかの理由が考えられます。

クラス名が長くなると、型注記を何度も書くのが辛くなる

上記の例の Cat 程度の長さならともかく、 普通のクラス名は MyProject::SomeModule::SomeClass のように長くなります。

   my MyProject::SomeModule::SomeClass $obj = ...;

とは、普通の perl プログラマーは書きたくないでしょう。時々見掛けるスタイルとして

  my __PACKAGE__ $obj = ...;

という書き方もありますが、依然として長過ぎます。

アクセサやコンストラクタを自動作成してくれない

オブジェクトのユーザにメンバー変数を直接参照/代入させることは、 そもそも OOP のカプセル化の思想に逆行しています。ですから、 結局ユーザ向けに(なんらかの手段で)アクセサを作らねばなりません。 コンストラクタも同様です。

つまり、 fields を宣言しただけでは十分に使いやすいクラスにならないため、 結局 Class::Accessor などを使う羽目になるのです。 それなら最初からアクセサ作成用のモジュールだけ使おう、 と考えるのは自然なことでしょう。

単一継承に縛られる

fields が perl に導入されたのは perl5.005 に遡ります。 当時はメモリー効率のため、 HASH の代わりに ARRAY ベースのオブジェクトが 用いられました。メンバーは ARRAY 上のオフセットとして表現されました。 このため、多重継承は禁止とされました。

その後、 perl5.009 で fields::new が本物の HASH を返すようになった後も、 多重継承を禁止する仕様が (互換性維持のため) 残ってしまいました。

A few tips you should know about fields.

なら MooseMouse 使う、が結論でいいじゃない? と思う人も多いでしょう。 でも、それは use strict 検査を一つ諦めることに他なりません。 メンバーアクセスの度に sub を呼ぶので速度も遅くなります。 (perl の sub 呼び出しは、それなりに重い操作です) 私から見れば、それは perl の強みを捨てて ruby や python の真似をする道 に見えます。外野から見れば、なら最初から ruby や python 使えば? と思ってしまうのではないでしょうか?

ここでもう少し、 fieldsstrict の組合せの可能性を見直して頂くため、 あまり知られていない事実を紹介します。

fields works even for unblessed HASH!

fields と型注記によるメンバー名検査はコンパイル時に行われるため、 実行時にその変数に何が入っているかは、実は無関係です。これはつまり、 bless していない HASH にすらスペル検査を適用可能であることを意味します。 以下は PSGI$env を静的検査する例です。 ( YATT::Lite::PSGIEnv の短縮版です)

   use strict;
   use 5.012;
   {
      package Env;
      use fields qw/REQUEST_METHOD psgi.version/; # and so on...
   };

   return sub {
      (my Env $env) = @_;
      given ($env->{REQUEST_METHOD}) { # Checked!
         when ("GET") {
           return [200, header(), ["You used 'GET'"]];
         }
         when ("POST") {
           return [200, header(), ["You used 'POST'"]];
         }
         default {
           return [200, header()
                  , ["Unsupported method $_\n", "psgi.version="
                     , join(" ", $env->{'psgi.version'})]]; # Checked too!
         }
      }
   };

   sub header {
      ["Content-type", "text/plain"]
   }

constant sub can be used for my TYPE slot.

実は型注記の箇所にはフルスペルのクラス名以外に、定数関数を書くことが出来ます。 (参考: aliased)

ですので、

   my MyProject::SomeModule::Purchase $obj = ...;

   sub Purchase () {'MyProject::SomeModule::Purchase'}

   ...

   my Purchase $obj = ...;

と書き直すことが出来ます。 この程度のキータイプ量なら、我慢できる人も増えるのではないでしょうか?

また副次的なメリットとして、コンストラクタ呼び出し時のクラス名も短く出来る上に、 サブクラス側でオーバライドすることも可能になります。

     ...
     # Subclass can override ->Purchase().
     my Purchase $obj = $self->Purchase->new(...);
     ...

values of %FIELDS can be anything now.

fields%FIELDS の抽象化APIです。 perl の内部的には、コンパイル時検査はパッケージごとの %PKG::FIELDS 変数を用いて行われます。 perlのコンパイラーは、 my PKG $var のようにスカラー変数の宣言に型注記がついていた場合、 定数をキーとする hash 要素参照 $var->{myfield} や代入 $var->{myfield} = ... の式を見付ける度に、 そのキー myfield がその時点での %PKG::FIELDS に含まれるかどうか検査します。 見付からない場合はエラーとしてコンパイルを中断します。

ところで、 %FIELDS の value 側はどう使われるのでしょう? 実は、最近の perl 5.12, 5.14 では value には何が入っていても構わないようです。 ...ならば、ここにメンバーに関するメタ情報を含めるスタイルもあり得るのではないでしょうか?!

(Proposed) Modern use of fields and strict.

以上を踏まえて、あまり頑張らなくても strict のメリットを享受できる、 fields 活用スタイルを提案します。

Divide and conquer.

まず始めに、外部と内部、クラスのユーザー側と、 そのクラスの中身を定義する側とを分けて考えることにします。

つまり、ユーザー側コードがオブジェクトの中身を直接参照/操作することは害が大きいですが、 それと比べてクラス定義本体の中でアクセサ関数を使うメリットは、 せいぜいフックやデフォルト値を持ちやすくなること程度です。 むしろアクセサのスペルミスが実行時まで検出されないことのデメリットの方が 大きいのではないでしょうか?

   my $foo = new Foo(width => 8, height => 3);
   $foo->{width} * $foo->{height};  # Evil!

   package Foo {
     use fields qw/width height/;
     sub area {
       my Foo $self = shift;
       $self->{width} * $self->{height};  # No problem.
     }
   };

ですので、 fields + strict の静的検査は、 モジュール内部のコード品質を改善するための道具と割り切って使うことにしましょう。

my MY $obj

型注記用の 型名 alias に、もっと短い名前を予め決めておくのはどうでしょう。 例えば、 package 宣言の先頭で sub MY () {__PACKAGE__} と書くことにすれば、以後のメソッド定義では my に加えて MY を書き加えるだけで strict 検査を効かせることが出来ます。

  package MyApp::Model::Company::LongLongProductName {
    sub MY () {__PACKAGE__};
    use fields qw/price/;

    sub add_price {
      (my MY $self, my $val) = @_;
      $self->{price} += $val;
      $self
    }
  };

勿論、短くて分かりやすい alias が他に思い付くならそれを用いれば良いのですが、 良い名前を考えることはそれなりの負担です。 ならば、基本の名前を決めておくのも悪くはないでしょう。 既に my を書くことに慣れ親しんだ use strict ready なプログラマーなら、 更に三文字を加えることにはすぐ慣れるはずです。

configure, cget + hand-made accessors.

ではクラスのユーザーに提供するアクセサとコンストラクタはどうするのか... ここでも一つの妥協を提案します。

メンバー名を引数とする汎用のアクセサ(cget と configure)と、 コンストラクタを持った短いクラスを定義し、 単にそれを継承して使うのです。 (ここでは "Perl/Tk" や tcl/tk の widget の API をモデルにします)。

   # ユーザ側コードゆえ、型注記なし
   my $obj = Foo->new(width => 8, height => 3);

   print $obj->cget('width') * $obj->cget('height');

   $obj->configure(height => undef, width => 3);

   print $obj->cget('width') * $obj->cget('height', 8); # default value
  • (この例では) public メンバと private メンバの区別のために、 コンベンションとして、 public なメンバーには全て cf_... で始まる名前を 付けることにします。なお、これは必須ではありません。 従来のアクセサ生成モジュールと併用したい場合にはプレフィックスを付けません。

  • write hook が必要な場合は configure_$name を実装します。 これは公開メンバ名に別名を持たせるためにも使えます。

       sub configure_file {
         (my Foo $foo, my $fn) = @_;
         $foo->{cf_string} = read_file($fn);
       }
  • ゲッターは頻度の高いものだけ、手で実装します。 (もちろん、アクセサ生成モジュールを併用する手もありえます)

       sub dbh {
         (my Foo $foo) = @_;
         $foo->{DBH} //= do {
            DBI->connect($foo->{cf_user}, $foo->{cf_password}, ...);
         };
       }
  • デフォルト値の設定は new から呼ばれる hook を作ってそこで処理します。 デフォルト値をオーバーライド可能にしたい場合は、そのためのメソッドを用意します。

       sub after_new {
         (my Foo $foo) = @_;
         $foo->{cf_name}       //= "(A cat not yet named)";
         $foo->{cf_birth_year} //= $foo->default_birth_year;
       }
       sub default_birth_year {
         _this_year();
       }

以下はサンプルとなるベースクラスです。 yatt の YATT::Lite::Object の短縮版です。

    use strict;
    use 5.009;
    package MyProject::Object { sub MY () {__PACKAGE__}
       use Carp;
       use fields qw//; # Note. No fields could cause a problem.
       sub new {
         my MY $self = fields::new(shift);
         $self->configure(@_) if @_;
         $self->after_new;
         $self
       }
       sub after_new {}

       sub configure {
          my MY $self = shift;
          my (@task);
          my $fields = _fields_hash($self);
          my @params = @_ == 1 && ref $_[0] eq 'HASH' ? %{$_[0]} : @_;
          while (my ($name, $value) = splice @params, 0, 2) {
            unless (defined $name) {
              croak "Undefined key for configure";
            }
            if (my $sub = $self->can("configure_$name")) {
              push @task, [$sub, $value];
            } elsif (not exists $fields->{"cf_$name"}) {
              confess "Unknown configure key: $name";
            } else {
              $self->{"cf_$name"} = $value;
            }
          }
          $$_[0]->($self, $$_[1]) for @task;
          $self;
       }

       sub cget {
          (my MY $self, my $name, my $default) = @_;
          my $fields = _fields_hash($self);
          unless (not exists $fields->{"cf_$name"}) {
              confess "Unknown configure key: $name";
          }
          $self->{"cf_$name"} // $default;
       }

       sub _fields_hash {
         my ($obj) = @_;
         my $symtab = *{_globref($obj, '')}{HASH};
         return undef unless $symtab->{FIELDS};
         my $sym = _globref($obj, 'FIELDS');
         *{$sym}{HASH};
       }
       sub _globref {
         my ($thing, $name) = @_;
         my $class = ref $thing || $thing;
         no strict 'refs';
         \*{join("::", $class, defined $name ? $name : ())};
       }
    };
    1;

これを継承したクラスの例です。

    package MyProject::Product; sub MY () {__PACKAGE__}
    use base qw/MyProject::Object/;
    use fields qw/
                  cf_name
                  cf_price
               /;

    1;

XXX: fields for scripts (rather than modules)

fields をコマンド行オプションに活用する手もあります。

XXX: More radical use of fields and %FIELDS

XXX: Write your own type builder.

XXX: YATT::Lite::Types の解説: モジュールの内部で使う、細かいレコード用のクラスのために 一々 *.pm を作るのは徒労感が激しい。データ構造を渡せば 一群のクラスを生成して fields を定義してくれる、そんなモジュールを作っておけば便利。

XXX: Direct use of %FIELDS.

XXX: YATT::Lite::MFields の技法の解説

XXX: Partial instead of Role.

XXX: YATT::Lite::Partial の技法の解説

1 POD Error

The following errors were encountered while parsing the POD:

Around line 268:

alternative text '"Perl/Tk"' contains non-escaped | or /