ATOK2006の省入力データ

ATOK2006では、ユーザ辞書登録以外にも「省入力」で使うデータを用意することで、変換辞書にユーザ単語を登録するのとはひと味違う入力ができるようになる。いわゆるインクリメンタル検索というたぐいのもので、打っている先からどんどん候補が表示される。打ち込み文字増えるにしたがって候補が絞られる。
で、この機能が専門用語などの入力に都合がいいようだ。
簡単には、単に単語のリスト(1単語1行)をクリップボードにコピーしておき、ATOKのプロパティ→入力・変換→省入力・推測変換→省入力データを開き、データの編集ボタンをクリック。先ほどコピーしたものがクリップボードの内容に表示されているはず。そこで登録するだけ。
 読みを入れなくても何とか候補を表示してくれるようになる。ATOK内部で漢字の読みを生成しているようだ。ときたまうまく表示(検索)してくれないこともある。
 思い通りの読みでちゃんと検索してくれるようにするためには、読みと表示を対応づけたリスト(テキスト形式のファイル)をあらかじめ用意して、ファイルから読み込んで登録する。

 ということでさっそく手持ちのデータから、管理栄養士国家試験のガイドラインから茶筌(形態素解析ツール)を使ってキーワードを抽出したものを、省入力データとして登録してみた。
 たとえば「ひ」と打ち込んだとたんに、候補ウィンドウに

必須アミノ酸
必須脂肪酸
非栄養素
非栄養素成分
非営利馳体
比較
皮下脂肪厚
非加熱用器具

酵素的褐変
非固形食
ヒスタミン
非蛋白呼吸商
肥大

などとずらっと「おいしい候補」が表示される。私的文書を書くときは煩わしいが。

ということでせっかくだから、作ったファイルを置いておく。(無償、改変自由、再配布の際はこのページへの参照を付加)
kanri.zip←ここからダウンロード
省入力データ(kari.ADR)
取り込むデータ(kanri.txt)
の2つが入っている。通常は、省入力データとしてADRファイルを指定すればよい。
ほぼ自動的に抽出したキーワードなのでおかしなもの、無意味なものも含まれている。またγグロブリンなど、ギリシャ文字で始まる物質名は含まれていない。