オフサイドルール

(Pythonのような)プログラミング言語のコードブロックのネストをインデントで表現する構文

オフサイドルール(Off-side Rule)とは、一部のプログラミング言語において字下げによって文などのかたまりの範囲(ブロック)を示す規則である。すなわち、そのような言語ではブロックは字下げによって形成され識別される。この用語と考え方は ピーター・ランディン英語版 によるもので、ここでのoff-sideは「(左端)側から離れる」という意味だが、これはサッカーなどの球技におけるオフサイド規則 (offside law) のもじりと考えられる。

レイアウト・ルールと呼ぶこともある[1]

定義 編集

前の行の空白以外の最初のトークンより左端寄りにある空白以外のトークンが新たな宣言の開始として解釈される。
— Peter J. Landin、"The Next 700 Programming Languages"[2]

ただし言語によっては、一見した見た目が似ているだけで、実際の規則は全く違う場合もある(ただし多くの文献などで、見た目の類似=同じもの、と紹介されているかもしれない)。

例えばHaskellの layout rule では[3]where, let, do, of という限定された4個のキーワードの直後のトークンが開き波括弧ではなかった場合にのみ、そのルールが発動し、改行とインデントの深さに応じて、いくつかの規則に従い、最初の開き波括弧、セミコロン及び閉じ波括弧が補完される、というものである。なおdoについてはdo式(do expressions)という[4]さらに別の、特別な記法の一部でもある。

注意 編集

英語版ウィキペディアに示されている英文は実際にこのようであるのだが、その英文そのままの表現は原文献中には見当たらないようである(英語版の該当記事のnoteにある議論も参照のこと)。該当する箇所は4枚目(160頁)の左カラムの下端付近、段落の頭に (c) とある部分で、"the offside rule." という明確な表現があるのも確認できるが、そこにはルールとして次のようにある。

The southeast quadrant that just contains the phrase's first symbol must contain the entire phrase, except possibly for bracketed subsegments.

直訳すると以下のような感じであろうか。

フレーズの最初のシンボルをちょうど含む南東の象限(southeast quadrant)は、フレーズ全体を含まねばならない。ただし、ブラケットによって囲まれた部分がある場合はそこは例外である。

これを、現代においてよく使われる用語で再解釈すると、「フレーズ全体」とはブロックの全体のことで、「最初のシンボル」は begin といったようなキーワードないしその次のトークン(の最初の文字)、といった感じになる。英語版の文章の初出は不明だが、FOLDOCの当該の項[5]の文中に見られる。

コード例 編集

以下の例は Python における字下げブロックを示している(コロンは可読性を高める構文上のマーカーでもある[6]

def is_even(a):
    if a / 2.0 == a / 2:
        return True
    else:
        return False

他の手法 編集

前述のように、Landin による提案がオフサイドルールのはじまりと一般に認知されているが、クヌースStructured Programming with go to Statementsで引用している Dewey Val Schorreの Improved Organization for Procedural Languages(Landin の提案と同じく1966年)に、

Since the summer of 1960, I have been writing programs in outline form, using conventions of indentation to indicate the flow of control. (以下略)

とあり、ほぼ同時期に他にも(おそらく複数)独立して同様の試行が存在している。

以下ではオフサイドルール以外のブロックの記法について概観する。

Cで一般化した手法として、余分な空白を無視して波括弧 {} でブロックを表すという方法がある。この方法の利点は、自動的に読みやすく字下げすることが可能で、しかもそれによってコードの意味が変化しない点である。人間が読むとき字下げに目が行ってしまい、括弧で表現されている真の構造を読み違える可能性があるが、真の構造をきちんと反映するように自動で修正するという手がある。

LISP(のS式)は、全ての開始と終了を丸括弧ないし角括弧で明示する(中括弧を使用する言語と同様、余分な空白は無視される)。そもそもS式(S-expression)はプログラムコードのリスト構造による内部表現をそのまま一種のリテラルのようにして表現(express)したものである。

他の手法として、ブロックの開始と終了を記号ではなくキーワードで表現する方法がある。ここで論じている他の構文と同様字下げには意味が無い。

ALGOLで一般化した手法として、"begin" でブロックを開始し、"end" でブロックを終了するという方法がある(これは、具象構文(見た目)は大きく違うが、抽象構文としては波括弧の言語とさほど違うものではない)。

いくつかの言語では、繰り返しや条件分岐を表現するキーワードが暗黙のうちにブロックの開始(や終了)も表現する。構造化BASICなどでは、ブロックはブロックをともなうキーワード自身(例えば "IF")で開始され、前に "END" をつけたキーワード(例えば "ENDIF")で終了する。Bourne Shellの一部の文法などでは、ブロック終了を示すキーワードは開始するキーワードを逆に綴ったものである(例えば、"if" で始まるブロックは "fi" で終了する)。EiffelRubyでは、ブロックをともなうキーワード自身(たとえば"if")で開始され、"end"で終了する。

オフサイドルールを採用している言語 編集

参考文献 編集

  1. ^ たとえば The Haskell 98 Report 2 Lexical Structure2023年9月3日閲覧。
  2. ^ Landin, Peter J. (3 1966). “The next 700 programming languages”. Communications of the ACM 9 (3): 157–166. doi:10.1145/365230.365257. https://www.cs.cmu.edu/~crary/819-f09/Landin66.pdf. 
  3. ^ The Haskell 98 Report 2.7 Layout2023年9月3日閲覧。
  4. ^ The Haskell 98 Report 3.14 Do Expressions2023年9月3日閲覧。
  5. ^ https://foldoc.org/off-side+rule 2023年9月3日閲覧。
  6. ^ Design and History FAQ — Python 3.7.0a0 documentation2023年9月3日閲覧。
  7. ^ SRFI 49: Indentation-sensitive syntax2023年9月3日閲覧。
  8. ^ SRFI 110: Sweet-expressions (t-expressions) 2023年9月3日閲覧。