記述文法(きじゅつぶんぽう)は、「実際の表現はどうなっているか」を捉える文法であり、「明らかに普通は使わないだろう?」という表現も含めて、「文法的に正しいかどうか」に関わる文法である。

例えば「できる」の命令形「できろ」は、規範文法では誤であるが、記述文法においては正である。日本語処理のうち、形態素解析において重要視される[1]

概論 編集

具体的には、橋本進吉岩淵悦太郎による動詞活用形について[注 1]、いろいろな理由から批判が出たことに起因する。焦点としては、「文語動詞の四段活用動詞の語幹は子音末尾である」のに対し、文語文法で「h」音末尾の動詞が学校文法では「ワ行音末尾動詞(w 音末尾動詞)」とされたが、その説明が理論的整合性に欠けているという話であった。それが問題になった1970年代末には、まだ「漢字の使えるパソコン」は普及しておらず、インターネットなどもなかった時代なので、SNOBOLはあったものの「コーパスデータの分析」という計算言語学は未発達であったことから[3][4]、検証は困難であった。

その後、ワープロやパソコンの普及などにより、「かな漢字変換」の高精度化に対するニーズが高まったが、記述文法への興味は喚起されなかった[注 2]。その後、1990年日本語の辞書引きツールが発売され、アスキーの VJE チームやアップルコンピュータ・ジャパンのことえりチームとも協業したが、いかんせん「かな漢字変換」とはいっても「ローマ字→かな→漢字かな交じり」というルートに沿っていたため記述文法の記述が複雑になり[注 3]、実装はされなかった。これには当時「不定長データと動的 GC を行なえるプログラミング言語が普及していなかった」という理由もある[注 4]

技法 編集

日本語の用言の活用は、基本的には簡単でありローマ字ベースで記述すれば C 言語などでも六百行程度のコードによって記述できる(ただし、かなとローマ字の対応関係が一意でないため、「あ」を「_a」、「ん」を「nn」などと記述しないと扱いが面倒になる)。 これに対し、従来の文語文法や学校文法で用いられている「かなベース」の記述を行なうと、おおむね二千行から三千行単位の記述になるため、国文法学者の手に余る(とはいえ、職業的なプログラマにとっては大した量ではないのだが、プログラマの多くは国文法学に堪能ではない)。 そこで、中間言語(PrologLISPなど)を用いた仮想言語システムを導入することが考えられたが、文字列処理に特化されていなかった(SQLは有望であったが[5]、先頭一致の文字列検索に対応していなかった)ために、言語処理の分野では普及はしなかった。

その他 編集

日本語の不規則活用動詞には、いわゆる「サ変(する)」「カ変(くる)」以外に、「いう(言う/云う/謂う)」や「いく(行く/征く/逝く)」があり、「乞う/請う」「問う」は文語の活用を遺しているということが検証されている。日本語の活用形を参照のこと。

脚注 編集

注釈 編集

  1. ^ これは、いわゆる学校文法に引継がれた[2]
  2. ^ 『bit』に「仕組みがわかれば腹も立たない」という記事が掲載された。
  3. ^ 当時、島内剛一によるローマ字かな変換が提言されていたが、プログラミング言語C全盛の時期であり、固定長データの扱いはともかく、ポインタやハンドルが絡んだプログラムを実装できるプログラマは少なかった。
  4. ^ 現在ではJavaがある。

出典 編集

  1. ^ 島田正雄 1992.
  2. ^ 肥爪周二 2016, p. 123.
  3. ^ 川本崇雄 1980.
  4. ^ 城生佰太郎 1990.
  5. ^ Oracle Qi は再帰呼出しをサポートしていた(CONNECT BY 構文)。木構造データの探索には便利だったため、三菱総研が日産のスカイラインGTの部品管理システムにおいて採用した例がある。

参考文献 編集

著書
  • 川本崇雄『日本語の源流』講談社講談社現代新書594〉、1980年10月。ISBN 406145594X 
  • 城生佰太郎『言語学は科学である:「象ガ国会デ宿題ヲ忘レル」不思議への招待』情報センター出版局、1990年11月。ISBN 4795810826 
論文
  • 島田正雄「汎用日本語解析系の試作:形態素解析コンパイラ・コンパイラの実現をめぐって」『bit』、共立出版、1992年12月。 
  • 肥爪周二「橋本進吉」『日本語学』第35巻第4号、明治書院、2016年4月、120-123頁。 

関連項目 編集

外部リンク 編集