どのようなデータを扱えるのか

最終更新日 2011.12.22

鍋田辞書をインストールしただけではデータを検索できません。
鍋田辞書とは別にデータを用意する必要があります。
鍋田辞書は以下のデータを直接検索できます。
各言語対応と各言語データも参照してください。
  1. 各種形式のテキストなどを鍋田形式(バイナリ)に変換したもの。
  2. 鍋田CGIデータ(CGIにも対応した新形式のデータ。Ver 4.2以降)
  3. テキストファイル
  4. EPWING、電子ブック(EB)形式データ。
  5. PDIC for Win32、PDIC/Unicodeの拡張子DICのバイナリデータ。
各種形式のテキストなどを鍋田形式(バイナリ)に変換したもの。
鍋田辞書は以下のデータを鍋田形式バイナリに変換して検索することができます。
テキストファイルの場合は、文字コードはSJIS、EUC-JP(JIS X 0212対応)、UTF-8、UCS2を自動認識して変換取り込みします。
(Ver 4.8未満はEUC-JPのテキスト読み込みにバグがあり一部の漢字、半角カタカナ全部を読めません。Ver 5.0は、EUC-JP(JIS X 0212、半角カタカナ対応)に読み込み、書き込みとも対応しています。)

  1. 鍋田辞書の編集画面で手入力したデータ。
  2. 鍋田テキスト形式(単語行の先頭がセミコロン、次の行から複数行が訳語、コメント行は行の先頭が#)
  3. 鍋田CGIデータ(CGIにも対応した新形式のバイナリデータ。Ver 4.2以降)
  4. 辞郎テキスト(英辞郎のテキストファイル。Ver 4.8以降)
  5. CSVファイル(単語先頭でカンマで区切ったデータ。横のセル数は何個でもよい)
  6. 旺文社ロワイヤル仏和中辞典第二版付属のCD-ROM
  7. 実用エスペラント小辞典のPEJVO.TXT形式のテキストファイル
  8. EDICT、EDICT2、CEDIT、WadokuJP形式テキストファイル
  9. (特殊な文字コードEUC-JP JIS X 0212拡張のテキストで配布のEDICT2はVer 4.8で対応)
  10. PDIC1行テキスト
  11. PDICテキスト(単語と訳語が一行ずつ交互のテキストファイル)
  12. WX2+形式テキスト


鍋田CGIデータ(新形式)

Ver 4.2からPerl版とPHP版の鍋田辞書でも使えるCGIデータを直接検索することができます。
データ登録画面の右上の「鍋田/PDIC/EPWING/TEXT/CGI」の5択で「CGI」を指定してください。
ファイルがひとつで、データサイズも小さく(テキストデータより大きい)、直接高速検索できるので配布に向いています。
元々は、鍋田辞書のCGI版(Perl、PHP)のために作られたデータ形式です。
読み込み専用なので、データ編集や単語の追加が必要な場合は、鍋田形式バイナリに変換登録してください。


テキストファイル

鍋田辞書はテキストファイルを変換することなくそのまま検索することもできます。
データ登録画面の右上の「鍋田/PDIC/EPWING/TEXT/CGI」の5択で「TEXT」を指定してください。
  1. 鍋田テキスト(鍋田辞書Ver 3.55以降)
  2. EDICTテキスト(EDICT2、CEDICT、WadokuJT含む。Ver 4.8以降)
  3. 辞郎テキスト(鍋田辞書Ver 3.55以降)
  4. PDIC1行テキスト(鍋田辞書Ver 3.55以降)
  5. プレインテキスト(書式なしテキスト)
のデータが扱えます。
文字コードはSJIS、EUC-JP、UTF-8、UCS2を自動認識します。
各種テキスト形式(鍋田/EDICT/辞郎/PDIC1行)は自動認識します。
Ver 3.53から辞書ファイルの設定でフォルダを指定するとフォルダ内の拡張子txtのファイルを全て同時検索します。
各種文字コード、各種書式のテキストが混在した状態でも複数ファイル同時検索ができます。 プレインテキスト以外は変換取り込みした場合とほぼ同じように動作します。
辞郎テキストにも対応していますが現在のバージョンでは英辞郎級の巨大ファイルでは検索が遅く実用的な速度では動きません。
鍋田形式テキスト、EDICTテキスト、辞郎テキスト、PDIC1行テキストのいずれでもないプレインテキスト(書式なしテキスト)の場合は単語と訳語の区別がつかないため動作に制限があります。
テキストファイルの直接検索ではファイルを全て走査するために検索速度を速くする仕組みは働きません。
Ver 5.0以降では辞郎テキストはSJISのソート順でソートしてある必要があります。
その他のテキストファイルはソートしてある必要はありません。
Ver 4.8未満のプレインテキストの検索はバグがあります。
Ver 4.8で、「続き表示」オプションと一応、インクリメンタルサーチに対応しました。
(現在のテキストファイル直接検索は高速検索に対応していないため、インクリメンタルサーチは速度的に苦しいです。)



EPWING、電子ブック(EB)のデータ

鍋田辞書はEPWING、電子ブック(EB)のデータを直接検索することができます。
電子ブック(EB)はすでに製造中止、販売中止となっております。
EPWINGはわずかながら市販のデータが現在も販売中です。
データ登録画面の右上の「鍋田/PDIC/EPWING/TEXT/CGI」の5択で「EPWING」を指定してください。
詳しくは鍋田辞書でのEPWING形式の検索についてを参照してください。



PDIC for Win32、PDIC/Unicodeのデータ

鍋田辞書はPDIC for Win32及びPDIC/Unicodeの拡張子DICのデータを直接検索することができます。
PDIC/Unicodeは一部、未対応のデータがあります。ローマ字の見出しを使っているデータで検索できない場合があります。
データ登録画面の右上の「鍋田/PDIC/EPWING/TEXT/CGI」の5択で「PDIC」を指定してください。
詳しくは鍋田辞書でのPDICの拡張子DICのファイル(Hyper形式)の検索についてを参照してください。
直接読めない場合は、PDIC1行テキストなどを経由して変換登録することもできます。
Ver 4.8以降では辞郎テキストがある場合も変換登録できます。




鍋田辞書ヘルプ
鍋田辞書ホームページ