2016年2月 6日 (土)

Wikipedia Reform Kit 6.0のバグ

■Wikipedia Reform Kit 6.0のバグ

IMG画像PCX化プログラム wbmpcx.exe のバグ
・tblファイルのアドレスを修正するときに,一部の画像について,不正な
 位置への書込みを行っていた.
・このため,辞書のアドレス書換え(waddr.exe)が,間違った画像アドレス
 で行われる事があった.

バグ修正版 WRKit60b.lzh
http://lxdic.cocolog-nifty.com/blog/download.html

[HP200LX/LXDIC]

|

2016年2月 5日 (金)

LXCALCセット

■LXCALCセット
LXCALCのSM版とDOS版のセット※
※起動キーによる利用制限はない.
.
LXCALC35.LZH
ファイル一覧
・LXCALC.EXM      Ver.3.5     SM版 (HP200LX専用)
・LXCALC.EXE       Ver.3.5    DOS版(HP200LX専用)
.
.
ダウンロードページ
===> http://lxdic.cocolog-nifty.com/blog/download.html
 .
[HP200LX/LXDIC]

|

2016年1月20日 (水)

広辞苑第6版のLXDIC形式への変換手順

第6版の機能を最大限に利用しようとすると,幾つかのユーティリティを個別に
適用する必要があり,処理がかなり煩雑になる.
(第5版の場合は,画像の処理だけなので,煩雑にはならない)
ここでは,全ての処理をまとめて,記録しておく.
                     .
///////////////////////////////////////////////////////////////////////
広辞苑第6版(EPWING版)のLXDIC形式への変換手順      
///////////////////////////////////////////////////////////////////////
広辞苑第6版(EPWING版)の辞書及び画像・音声データを,HP200LX上のLXDIC
で使用するための形式に変換する.

処理の概要
・インデックス等を削除することなく,全ての機能を使う.(227MB)
 複合検索(漢字検索など),条件検索(全文検索),クロス検索(諺)
・カラー画像はモノクロ画像に変換して使用する.(90MB)
 写真,イラスト,表,数式,漢字拡大図,漢字書順画像等
・PCM音声は,コンパクトな第5版の形式に変換して使用する.(74MB)
 鳥の鳴声,クラシック音楽,日本民謡
・辞書の既知のバグは修正する.

 

========================
  必要なプログラム
========================
1.広辞苑第6版バグ修正プログラム  Kj6BFix Ver.2
    kj6bfix.exe   バグ修正実行ファイル 

2.音声コンバータ(汎用版または専用版)
  ・広辞苑第6版 PCM音声コンバータ(汎用版)  PCMCONV.LZH
    pcmconv.exe    音声ファイルサイズ縮小
    pcmaddr.exe    辞書の音声アドレス書換
  ・広辞苑第6版 PCM音声コンバータ(LXDIC専用)P56CONV.LZH
    p56conv.exe    音声変換(5版+6版の音声を使う)
    pcmaddr.exe    辞書の音声アドレス書換

  ※以下の説明では,専用版を使用する.
    p56conv.exe    音声ファイルサイズ縮小
    pcmaddr.exe    辞書の音声アドレス書換

3.画像コンバータ(汎用版または専用版)
  ・画像コンバータ   汎用版 Ver 4.0  GCONV40.LZH
    gconv.exe    画像変換プログラム
    gaddr.exe    アドレス書換プログラム
    djpeg.exe    jpegデコーダ  (JPEG Group)    
    cjpeg.exe    jpegエンコーダ(JPEG Group)    
  ・画像コンバータ   広辞苑第6版専用版 Ver6.0  KJ6CONV.LZH
    kj6conv.exe  画像変換プログラム
    kj6addr.exe  アドレス書換プログラム
    djpeg.exe    jpegデコーダ  (JPEG Group)    
    cjpeg.exe    jpegエンコーダ(JPEG Group)    

  ※以下の説明では,専用版を使用する.
    kj6conv.exe  画像変換プログラム
    kj6addr.exe  アドレス書換プログラム

========================
    処理手順
========================

0.準備
   辞書 honmon2 の圧縮を解除する.
   honmon2 ===> honmon.org
   honmons(音声ファイル),honmong(画像ファイル)はそのまま使う.
   広辞苑第5版と第6版の上記ファイルが以下の場所にあると仮定する.
      x:\kj5\       第5版の音声ファイルを使う場合がある
      x:\kj6\       第6版

   必要なファイルを作業用ディレクトリにコピーする.
     kj6bfix.exe
     kj6conv.exe
     kj6addr.exe
     cjpeg.exe 
     djpeg.exe
     p56conv.exe
     pcmaddr.exe

1.辞書のバグ修正
  -----------------------------------------------
    kj6bfix x:\kj6\honmon.org honmon.fix
                    ↑元辞書     ↑新辞書名
  -----------------------------------------------
        入力:honmon.org   <-- 元の辞書
        出力:honmon.fix   <-- 修正された辞書
              kj6bfix.log  <-- ログ

2.音声変換
    (新しい辞書名を kojien とする場合の例)
  ------------------------------------------------
    p56conv x:\kj5\honmons x:\kj6\honmons kojien
  ------------------------------------------------
      入力ファイル:honmons5    5版の音声ファイル
                  :honmons6    6版の音声ファイル
      出力ファイル:kojien.snd   音声ファイル
                    kojien.ptb   アドレス変換表
                    kojienP.log  変換ログ

3.音声アドレス書換
   (新しい辞書名を kojien とする場合の例)
  ------------------------------------------------
    pcmaddr honmon.fix kojien
  ------------------------------------------------
      入力ファイル:kojien.hon      圧縮解除後の辞書ファイル
                    kojien.ptb     アドレス変換表
      出力ファイル:kojien.phn     音声アドレス書換済の辞書
                    kojienQ.log    音声アドレス書換ログ

4.画像変換
  カラー画像を,モノクロビットマップに変換する.
  -----------------------------------------------
    kj6conv x:\kj6\honmong kojien 
  -----------------------------------------------
       (入力ファイル)    honmong       画像ファイル <== 変更されない
      (出力ファイル)   kojien.img     新画像ファイル
                         kojien.tbl     アドレス変換テーブル
                         kojienA.log    変換ログ

5.画像アドレス書換
  新辞書ファイルを作成し,画像参照アドレスを更新する.
  ------------------------------------------------
    kj6addr kojien.phn kojien
  ------------------------------------------------
       (入力ファイル)    kojien.phn    本文ファイル <== 変更されない
                         kojien.tbl    アドレス変換テーブル
      (出力ファイル)   kojien.hon    新しい辞書ファイル
                         kojienB.log   アドレス書換ログ

 

生成されるファイル(○はLXDICで使うファイル)
  honmon.fix     バグ修正済の辞書
  kj6bfix.log    バグ修正ログ
○ kojien.snd     LXDIC用音声ファイル
  kojien.ptb     アドレス変換表
  kojienP.log    PCM音声変換ログ
  kojien.phn     音声アドレス書換済の辞書
  kojienQ.log    音声アドレス書換ログ
○ kojien.img     LXDIC用画像ファイル
  kojien.tbl     アドレス変換テーブル
  kojienA.log    画像変換ログ
  kojienB.log    アドレス書換ログ
○ kojien.hon     音声画像処理済辞書ファイル(LXDIC用辞書)
 
 
一括処理の例
honmon.org, honmong, honmons が以下のディレクトリにある場合
 広辞苑第5版:e:\koji5\kojien\data\
 広辞苑第6版:e:\koji6\kojien\data\
 
kj6make.bat
----------------------------------------------------------------------
rem バグ修正
    kj6bfix e:\koji6\kojien\data\honmon.org honmon.fix
    @if ERRORLEVEL 1 goto end
rem PCM音声変換:5版と6版の音声を利用
    p56conv e:\koji5\kojien\data\honmons e:\koji6\kojien\data\honmons kojien
    @if ERRORLEVEL 1 goto end
rem 音声アドレス書換
    pcmaddr honmon.fix kojien
    @if ERRORLEVEL 1 goto end
rem 画像変換
    kj6conv e:\koji6\kojien\data\honmong kojien 
    @if ERRORLEVEL 1 goto end
rem 画像アドレス書換
    kj6addr kojien.phn kojien
    @if ERRORLEVEL 1 goto end
@goto end2
:end
@echo off
echo program error!! 
:end2
----------------------------------------------------------------------

[HP200LX/LXDIC]

|

2016年1月15日 (金)

技術資料:JIS X4081のデータ構造

■技術資料:JIS X4081のデータ構造        
(EPWING仕様の実際の辞書とは異なる部分がある)
     .
JIS X4081:2002 『日本語電子出版検索データ構造』
     .     
////////////////////////////////////////////////////////////////////////////
採録書籍名管理ファイル                           byte    種類
|採録書籍数                                      2      binary
|予備領域1                                     14
|[書籍ファイル管理情報] ++               (164)
|  |予備領域2                                   2      実装で定義
|  |書籍名称                                    80      JIS文字
|  |書籍ディレクトリ名                           8      ファイル名用文字
|  |書籍ファイルディレクトリ位置                 4      binary
|  |書籍管理情報記録位置                         2      binary
|  |予備領域3                                  68      実装で定義
|[書籍ファイル管理拡張情報] ++           (164)
|  |機能種別                                     4      binary
|  |書籍ファイル名                               8      ファイル名用文字
|  |予備領域4                                  12
|  |連続再生ファイルディレクトリ位置             4      binary
|  |連続再生ファイル名                           8      ファイル名用文字
|  |マルチメディアファイルディレクトリ位置       4      binary
|  |[マルチメディアデータ種別]             (4)
|  |  |予備領域6                                1
|  |  |データ種別1  file2                       1     b0=音声
|  |  |データ種別2  file1                       1     b0=音声,b1=カラー画像
|  |  |データ種別3                              1     b0=本文との連携
|  |マルチメディアファイル名1                   8      ファイル名用文字
|  |[圧縮種別]                             (4)        binary
|  |  |予備領域7                                1
|  |  |圧縮領域1   file2                        1     00h=圧縮なし
|  |  |圧縮領域2   file1                        1     00h=圧縮なし
|  |  |圧縮領域3   本文                         1     !00h=圧縮
|  |マルチメディアファイル名2                   8      ファイル名用文字
|  |刷数                                         2      BCD 上位2桁
|  |予備領域5                                  98      将来拡張

 

////////////////////////////////////////////////////////////////////////////
書籍ファイル
|書籍管理情報
|  |書籍構成要素数                                2     binary
|  |予備領域1                                    2
|  |インデックス作成情報の取扱法                  1     binary
|  |予備領域2                                   11
|  |[書籍構成要素] ++                 (16)
|  |  |書籍構成要素識別子                         1    binary
|  |  |予備領域3                                 1
|  |  |先頭アドレス (ブロック番号)                4    binary: big endian
|  |  |領域サイズ   (ブロック数)                  4    binary: big endian
|  |  |インデックス作成情報有効性                 1    01h=有効,02h=無効
|  |  |インデックス作成情報                       3    binary
|  |  予備領域4                                  2
|  |[表示方法の初期値情報]             (16)
|  |  |有効無効フラグ                             1    00h=無効, 01h=有効
|  |  |予備領域5                                 3
|  |  |一覧表表示                                 1    00h=本文,01h=一覧表
|  |  |本文表示法                                 1    00h=項目単位,01h=本文
|  |  |予備領域6                                10
|
|本文データ
|  |表示開始指定   1F02h                             2
|  |[項目データ] ++
|  |  |検索キー記述子      1F41h                     2
|  |  |[表示用データ] **
|  |  |  |表示制御記述子
|  |  |  |表示文字列
|  |  |  |表示制御終了記述子
|  |  |検索キー終了記述子  1F61h                     2
|  |  |[別記事参照] **
|  |  |  |o[別項目参照]
|  |  |  |  |別項目参照記述子       1F42h            2
|  |  |  |  |矢印コード                              2
|  |  |  |  |表示文字列
|  |  |  |  |別項目参照終了記述子   1F62h            2
|  |  |  |  |[アドレス情報]
|  |  |  |  |  |ブロック番号                         4   BCD
|  |  |  |  |  |ブロック内オフセット                 2   BCD
|  |  |  |o[カラー動画表示]
|  |  |  |  |カラー動画表示記述子     1F39           2
|  |  |  |  |表示モード                              2   BCD
|  |  |  |  |動画識別指標                            2   BCD
|  |  |  |  |表示位置                                8   BCD
|  |  |  |  |開始フレーム番号                        4   BCD
|  |  |  |  |終了フレーム番号                        4   BCD
|  |  |  |  |動画ファイル名
|  |  |  |  |代替データ格納書籍番号                  2   BCD
|  |  |  |  |代替データアドレス情報                  6   BCD
|  |  |  |  |表示文字列
|  |  |  |  |カラー動画表示終了記述子  1F59          2
|  |  |  |o[アプリケーション参照]
|  |  |  |  |アプリケーション参照記述子     1F3Ah    2
|  |  |  |  |参照種別                                2   BCD
|  |  |  |  |アプリケーション参照データ
|  |  |  |  |改行                           1F0Ah    2
|  |  |  |  |メッセージ
|  |  |  |  |改行                           1F0Ah    2
|  |  |  |  |キャプション
|  |  |  |  |アプリケーション参照終了記述子 1F5Ah    2
|  |  |  |o[URL参照]
|  |  |  |  |URL参照記述子      1F3Bh                2
|  |  |  |  |URL参照データ
|  |  |  |  |改行               1F0Ah                2
|  |  |  |  |キャプション
|  |  |  |  |URL参照終了記述子  1F5Bh                2
|  |  |  |o[インライン画像参照]
|  |  |  |  |インライン画像参照記述子     1F3Ch      2
|  |  |  |  |[インライン再生情報]             (16)
|  |  |  |  |  |インライン表示モード                 2   BCD
|  |  |  |  |  |再生識別番号                         2   BCD
|  |  |  |  |  |予備領域1                           0
|  |  |  |  |  |図版サイズ                           8   BCD
|  |  |  |  |アドレス情報                            6   BCD
|  |  |  |  |インライン代替文字列
|  |  |  |  |インライン画像参照終了記述子 1F5Ch      2
|  |  |  |o[図版参照]
|  |  |  |  |図版データ記述子     1F44h              2
|  |  |  |  |[図版情報]                       (10)
|  |  |  |  |  |再生識別番号                         2   BCD
|  |  |  |  |  |図版サイズ                           8   BCD
|  |  |  |  |  |表示文字列
|  |  |  |  |図版データ終了記述子 1f64h              2
|  |  |  |  |アドレス情報                            6   BCD
|  |  |  |o[図版群参照]
|  |  |  |  |図版データ群記述子     1F45             2
|  |  |  |  |図版参照...++
|  |  |  |  |図版データ群終了記述子 1F65             2
|  |  |  |o[音声参照]
|  |  |  |  |音声データ参照記述子     1F4A           2
|  |  |  |  |音声再生モード                          2   BCD
|  |  |  |  |音声タイプ                              2   BCD
|  |  |  |  |アドレス情報                            6   BCD
|  |  |  |  |終了アドレス情報                        6   BCD
|  |  |  |  |矢印コード                              2
|  |  |  |  |表示文字列
|  |  |  |  |音声データ参照終了記述子 1F6A           2
|  |  |  |o[カラー画面データ群参照]
|  |  |  |  |カラー画面データ群記述子  1F4C          2
|  |  |  |  |カラー画面モード                        2   BCD
|  |  |  |  |[画面データ]...++
|  |  |  |  |  |(カラー画面表示,カラー画面音声,カラー画面参照)
|  |  |  |  |  |(カラー画面表示,カラー画面動画,カラー画面参照)
|  |  |  |  |  |(カラー画面表示,カラー画面音声)
|  |  |  |  |      
|  |  |  |  |    [カラー画面表示]
|  |  |  |  |       カラー画面表示記述子     1F4D    2
|  |  |  |  |       カラー画面表示モード             2   BCD
|  |  |  |  |       再生識別番号                     2   BCD
|  |  |  |  |       表示位置                         8   BCD
|  |  |  |  |       アドレス情報                     6   BCD
|  |  |  |  |       表示文字列
|  |  |  |  |       カラー画面表示終了記述子 1F6D    2
|  |  |  |  |    [カラー画面音声]
|  |  |  |  |       カラー画面音声記述子     1F4E    2
|  |  |  |  |       音声用入力待モード               2   BCD
|  |  |  |  |       処理タイマー                     2   BCD
|  |  |  |  |       再生識別番号                     2   BCD
|  |  |  |  |       ボタン表示位置                   8   BCD
|  |  |  |  |       アドレス情報                     6   BCD
|  |  |  |  |       音声タイプ
|  |  |  |  |       アドレス情報                     6   BCD
|  |  |  |  |       終了アドレス情報                 6   BCD
|  |  |  |  |       カラー画面音声終了記述子  1F6E   2
|  |  |  |  |    [カラー画面参照]
|  |  |  |  |       カラー画面参照記述子      1F4F   2
|  |  |  |  |       画面参照用入力待モード           2   BCD
|  |  |  |  |       処理タイマー                     2   BCD
|  |  |  |  |       再生識別番号                     2   BCD
|  |  |  |  |       ボタン表示位置                   8   BCD
|  |  |  |  |       アドレス情報                     6   BCD
|  |  |  |  |       再生識別番号                     2
|  |  |  |  |       追加表示位置                     8
|  |  |  |  |       アドレス情報                     6   BCD
|  |  |  |  |       表示文字列
|  |  |     |       カラー画面参照終了記述子  1F6F   2
|  |  |     |                                 
|  |  |     |カラー画面データ群終了記述子  1F6C
|  |  |[表示用データ]...
|  |                     
|  |表示終了指定   1F03h                             2
|  |
|  |[メニュー表示用データ] **                        
|  |  |[メニュー項目] ++                              
|  |  |  |メニュー記述子      1F43h                  2
|  |  |  |[表示用データ]                            
|  |  |  |  |表示制御記述子                          2
|  |  |  |  |表示文字列                              
|  |  |  |  |表示制御終了記述子                      2
|  |  |  |[別項目参照] **
|  |  |  |メニュー終了記述子  1F63h                  2
|  |     |アドレス情報                               6   BCD
|  |[入力候補テーブル]
|  |  |表示開始指定   1F02h                          2
|  |  |メニュー項目 **
|  |  |表示終了指定   1F03h                          2
|   
|   
|著作権表示データ
|   |[表示用データ] **
|   |  |表示制御記述子                               2
|      |文字列
|      |表示制御終了記述子                           2
|
|
o1インデックス
|   |[上位インデックス]+
|   |  |インデックス群識別                           1
|   |  |キー長                                       1
|   |  |上位エントリ数                               2
|   |  |[上位エントリ]                   (4+key長)
|   |     |上位エントリキー情報                   キー長
|   |     |下位エントリ所在ブロック番号              4
|   |[最下位インデックス]                 (4)
|   |  |インデックス群識別                           1
|   |  |キー長                                       1
|   |  |エントリ数                                   2
|   |  |o[集団概念付きエントリ]
|   |  |  |o[基本エントリ]
|   |  |  |     |エントリ識別                        1
|   |  |  |     |キー長                              1
|   |  |  |     |基本エントリキー情報              キー長    文字
|   |  |  |     |項目アドレス                       12
|   |  |  |o[集団エントリ]
|   |  |     |  |エントリ識別                        1
|   |  |     |  |キー長                              1
|   |  |     |  |メンバー数                          4
|   |  |     |  |集団エントリキー情報              キー長    文字
|   |  |     |[メンバー情報]
|   |  |     |  |メンバー識別                        1
|   |  |     |  |キー長                              1
|   |  |     |  |キー情報                          キー長    文字
|   |  |     |[項目アドレス]
|   |  |        |項目所在ブロック番号                4
|   |  |        |項目所在ブロック内オフセット        2
|   |  |        |候補リスト所在ブロック番号          4
|   |  |        |候補リスト所在ブロック内オフセット  2
|   |  |         
|   |  |o[一般エントリ]
|   |  |  |キー長                                    1
|   |     |キー情報                                キー長    文字
|   |     |[項目アドレス]                  
|   |     |  |項目所在ブロック番号                   4
|   |        |項目所在ブロック内オフセット           2
|   |        |候補リスト所在ブロック番号             4
|   |        |候補リスト所在ブロック内オフセット     2
|         
|         
o1メニュー表示データ
|   |[メニュー項目]+
|   |   |メニュー記述子      1F43h                   2
|   |   |[表示用データ]
|   |   |   |表示制御記述子                          2
|   |   |   |表示文字列
|   |   |   |表示制御終了記述子                      2
|   |   |[別項目参照]*
|   |   |メニュー終了記述子  1F63h                   2
|   |   |アドレス情報                                6   BCD
|
o1検索名称定義データ
|   |エントリ数                                      2
|   |予備領域1                                     68
|   |[前方/後方一致検索用検索名称]                  70
|   |   種類(2 BCD),略称(16),正式検索名称(32)    
|   |[条件検索用検索名称]                           70
|   |   種類,略称,正式検索名称                   
|   |[複合語検索用検索名称]                         70
|   |   種類,略称,正式検索名称                   
|   |予備領域2                                     70
|   |[複合検索用検索名称1]                         70
|   |   種類,略称,正式検索名称                   
|   |[複合検索用検索名称2]                         70
|   |   種類,略称,正式検索名称                   
|   |[複合検索用検索名称3]                         70
|   |   種類,略称,正式検索名称                   
|   |[複合検索用検索名称4]                         70
|   |   種類,略称,正式検索名称                   
|   |[複合検索用検索名称5]                         70
|   |   種類,略称,正式検索名称                   
|   |[複合検索用検索名称6]                         70
|   |   種類,略称,正式検索名称                   
|   |[複合検索用検索名称7]                         70
|   |   種類,略称,正式検索名称                   
|   |[複合検索用検索名称8]                         70
|   |   種類,略称,正式検索名称                   
|   |[複合検索用検索名称9]                         70
|   |   種類,略称,正式検索名称                   
|   |[複合検索用検索名称10]                         70
|   |   種類,略称,正式検索名称                   
|   |[メニュー用検索名称]                           70
|   |   種類,略称,正式検索名称                   
|   |予備領域3                                    
|    
o2書籍定義文字パターン
|   |[制御情報]                         (2048)
|   |  |予備領域1                                  1
|   |  |予備領域2                                  7
|   |  |横ドット構成                                1   binary
|   |  |縦ドット構成                                1   binary
|   |  |先頭構成                                    2   binary
|   |  |登録パターン数                              2   binary
|   |  |予備領域3                               2034
|   |[パターンブロック] +               (1024)
|   |  |文字パターン +                    (width*hight/8)
|      |空き領域                                    
o2検索アシスト用データ
o2複合検索管理情報
|   |複合エントリ数                                 2
|   |予備領域1                                    14
|   |[複合エントリ] +
|      |書籍構成要素数                              1
|      |予備領域2                                  1
|      |検索名称                                   30    文字
|      |[書籍構成要素] +
|         |書籍構成要素識別子                       1
|         |予備領域3                               1
|         |先頭アドレス                             4    binary
|         |領域容量                                 4    binary
|         |予備領域4                               5

          
          

書籍構成要素識別子
----------------------------------------------------------------
識別子  |    意味
----------------------------------------------------------------
  00h    | 本文データ
  16h    | 検索固有名称定義データ
  20h    | メニュー表示データ
  21h    | 著作権表示データ
  23h    | 著作権表示データ(1行表示用)
  70h    | 後方一致かな検索インデックス
  71h    | 後方一致表記形検索インデックス
  80h    | 条件検索インデックス
  81h    | 複合語検索インデックス
  90h    | 前方一致かな検索インデックス
  91h    | 前方一致表記形検索インデックス
         |
  F1h    | 16×16ドット書籍定義文字パターン
  F2h    |  8×16ドット書籍定義文字パターン
  F3h    | 24×24ドット書籍定義文字パターン
  F4h    | 12×24ドット書籍定義文字パターン
  F5h    | 30×30ドット書籍定義文字パターン
  F6h    | 15×30ドット書籍定義文字パターン
  F7h    | 48×48ドット書籍定義文字パターン
  F8h    | 24×48ドット書籍定義文字パターン
  FFh    | 複合検索管理情報
----------------------------------------------------------------

 
 

JIS文字          0x2121 -- 0x7426
外字                0xA121 -- 0xFE7E
本文内データ記述子  0x1F00 -- 0x1FFF

ブロック番号               4バイト  BCD
ブロック内オフセット       2バイト  BCD

インライン表示モード        2 byte    BCD
       1桁目    0: DIB
                 1: JPEG等倍表示
                 2: JPEG拡張表示(文字フォントの高さに合わせて拡大/縮小)
                 3: JPEG拡張表示(文字フォントの高さの2倍に合わせて拡大/縮小)
       2桁目      予備領域
       3桁目    0: 文字列のベースラインに画像の中央を合わせる
                 1: 文字列のボトムラインに画像の下辺を合わせる
                 2: 文字列のトップラインに画像の上辺を合わせる
       4桁目    0: 文字列が縦並びになっても,画像を回転しない
                 1: 文字列が縦並びになったときは,右90度回転させる

カラー画面表示モード        2バイト  BCD
     1桁目    0: DIB
               1: JPEG
     2桁目    0: 後続の表示用データを1行分(改行まで)表示.
                  画像の印刷・複写は許可
               1: 後続の表示用データは無効.画像の印刷・複写は許可
               2: 後続の表示用データを全て表示する.
                  1行目が名称,2行目が著作権を意味する.
               3: 予備
               4: 後続の表示用データは1行分表示.画像の印刷・複写は禁止
               5: 後続の表示用データは無効.画像の印刷・複写は禁止
               6: 後続の表示用データをすべて表示.画像の印刷・複写は禁止
     3桁目    0: 表示位置の調整を表示ソフトに任せる
               1: 左に寄せて表示
               2: 右に寄せて表示
               3: 中央に表示
     4桁目    0:
               1: 一般表示(排他的)
               2: 上書き(重ね合わせ)
               3-8: 予備
               9: 文字列と混在表示(表示座標は無効)

|  |インデックス作成情報の取扱法            1     binary
|  |    00h=各要素の有効性による
|  |    01h=無効
|  |    02h=有効

      インデックス作成情報                   3    binary
        片仮名,             2 bit
        英小文字,           2
        記号,               2
        長音文字,           2
        促音文字             2
        拗音文字,           2
        外来語用小文字,     2
        濁音記述,           2
        半濁音記述           2
        予備領域             6

上位インデックス(b7,b6,b5)  下位インデックス(b7,b6,b5,b4)
インデックス群識別  (binary 1 byte)
  b7        0:上位インデックス    1:最下位インデックス
  b6        0:先頭でない          1:先頭である        (同階層インデックスで)
  b5        0:最終でない          1:最終である        (同階層インデックスで)
  b4        0:一般エントリ        1:集団エントリ     (下位インデックス) 
  b4 -- b0  使用しない

  1111 0000  F0  最下位,先頭,最終,集団
  1110 0000  E0  最下位,先頭,最終
  1101 0000  D0  最下位,先頭,      集団
  1100 0000  C0  最下位,先頭
  1011 0000  B0  最下位,最終,       集団
  1010 0000  A0  最下位,最終
  1001 0000  90  最下位,(中間),     集団
  1000 0000  80  最下位,(中間)
  0110 0000  60  上位,先頭,最終
  0100 0000  40  上位,先頭
  0010 0000  20  上位,最終
  0000 0000  00  上位,(中間)

エントリ識別  (binary 1 byte)
  00  基本エントリ
  80  集団エントリ
  C0  メンバー識別


記述子一覧
-------------------------------------------------------------------------------
  値   | 記述子名                  |        意味,取扱い
-------------------------------------------------------------------------------
1F02h  表示開始指定                  一連の項目データ群の最初
1F03h  表示終了指定                  一連の項目データ群の最終

1F04h-1F38h 表示制御用割当てコード   --

1F39h  カラー動画表示記述子          動画データへのリンク情報の先頭
1F3Ah  アプリケーション参照記述子    アプリケーションへのリンク情報の先頭
1F3Bh  URL参照記述子              URLへのリンク情報の先頭
1F3Ch  インライン画像参照記述子      参照データへのリンク情報の先頭
1F40h  予備                          --
1F41h  検索キー記述子                検索結果の項目の先頭
1F42h  別項目参照記述子              関連項目の記録位置
1F43h  メニュー記述子                メニュー項目の先頭
1F44h  図版データ記述子              図版データへのリンク情報の先頭
1F45h  図版データ群記述子            図版データへのリンク情報の先頭
                                      (同一内容で再生方法の異なるものの集合)
1F46h-1F48h   予備                  

1F49h  構造化メニュー記述子          階層構造をもつメニュー項目の先頭
1F4Ah  音声データ参照記述子          音声データのリンク情報の先頭
1F4Bh  カラー画像データ群参照記述子   カラー画像データ群へのリンク情報の先頭
1F4Ch  カラー画面データ群記述子      表示画面からの検索のためのデータの先頭
1F4Dh  カラー画面表示記述子          表示位置付き画像へのリンク情報の先頭
1F4Eh  カラー画面音声記述子          音声付きデータへのリンク情報の先頭
1F4Fh  カラー画面参照記述子          時間要素をもつデータへのリンク情報の先頭

1F50h-1F58h   予備                   --

1F59h  カラー動画表示終了記述子       動画データへのリンク情報の末尾
1F5Ah  アプリケーション参照終了記述子 アプリケーションへのリンク情報の末尾
1F5Bh  URL参照終了記述子           URLへのリンク情報の末尾
1F5Ch  インライン画像参照終了記述子   参照データへのリンク情報の末尾
1F60h  予備                          --
1F61h  検索キー終了記述子            検索結果の項目の末尾
1F62h  別項目参照終了記述子          関連項目の記録位置
1F63h  メニュー終了記述子            メニュー項目の末尾
1F64h  図版データ終了記述子          図版データへのリンク情報の末尾
1F65h  図版データ終了群記述子        図版データへのリンク情報の末尾
                                      (同一内容で再生方法の異なるものの集合)
1F66h-1F68h   予備                  

1F69h  構造化メニュー終了記述子      階層構造をもつメニュー項目の末尾
1F6Ah  音声データ参照終了記述子      音声データのリンク情報の末尾
1F6Bh  カラー画像データ群参照終了記述子 カラー画像データ群へのリンク情報の末尾
1F6Ch  カラー画面データ群終了記述子    表示画面からの検索のためのデータの末尾
1F6Dh  カラー画面表示終了記述子      表示位置付き画像へのリンク情報の末尾
1F6Eh  カラー画面音声終了記述子      音声付きデータへのリンク情報の末尾
1F6Fh  カラー画面参照終了記述子      時間要素をもつデータへのリンク情報の末尾

1F70h-1F80h    予備                  
1F81h-1FDFh    予備                  
-------------------------------------------------------------------------------


表示制御記述子
-------------------------------------------------------------------------------
  値   | 記述子名                 |        意味,取扱い
-------------------------------------------------------------------------------
1F04h  半角開始指定                後続の文字列を半角表示する
1F05h  半角終了指定                半角表示終了
1F06h  下添字開始指定              後続の文字列を下添字表示する
1F07h  下添字終了指定              下添字終了
1F08h  --                         
1F09h  字下げ指定                  後続文字列を指定数(BCD 2byte)字下げする
1F0Ah  改行                        改行
1F0Bh  表の表示開始指定            表の表示開始
1F0Ch  表の表示終了指定            表の表示終了
1F0Dh  --                         
1F0Eh  上添字開始指定              上添字開始
1F0Fh  上添字終了指定              上添字終了

1F10h  分割禁止開始指定            後続する文字列の途中で行を折り返さない
1F11h  分割禁止終了指定            分割禁止終了
1F12h  強調開始指定                強調表示開始.強調方法は再生システムに依存
1F13h  強調終了指定                強調表示文字列の終端
1F14h  --                         
1F15h  --                         
1F16h  ルビ対象文字列開始指定      下添字の中で被ルビ文字との境界を示す
1F17h  読み上げ対象文字列開始指定  読み上げ対象文字列の先頭
1F18h  置き換え文字開始指定        他への転記のときに置換する文字列の先頭
1F19h  --                         
1F1Ah  タブ位置指定                表の中における各エントリの開始位置を示す
1F1Bh  字下げ・字上がり指定        後続する表データの行端の先頭と末尾位置

1FE0h  文字修飾指定                文字列の表示修飾.上述の区切り指定を用いる
1FE1h  文字修飾終了指定            文字修飾指定の終了

1FE2h-1FFFh   予備                
-------------------------------------------------------------------------------

|

2016年1月13日 (水)

LXDICの表示行数の不揃い

■LXDICの表示行数の不揃い
                                   .
●現象
図版メニューの一覧表示で行数が多い場合に,その分割表示の表示行数が一定
にならず,極端に不揃いになる事がある.
(例)500行,100行,500行,100行,500行,....
                                   .
●原因
広辞苑第6版では,図版メニューで行数が多い場合,分割して表示する仕様
になっているが,これがLXDICの分割表示と競合している.
バッファー20KBの場合,LXDICは大きな項目を約500行ずつ分割表示する.
しかし,辞書が600行程度で項目を分割していると,LXDICが600行を,500行
と100行に分割してしまうことになる.
                                   .
Enter,F8(次項目)により,続きを表示できるので,実用上の問題はない.
                                   .
[HP200LX/LXDIC]

|

2016年1月11日 (月)

広辞苑第6版バグ修正プログラム 第2版

■広辞苑第6版バグ修正プログラムの改訂
音声アドレスの誤りに加え,既に公表されていた「あしや【芦屋・蘆屋】」
の項目の誤りも,修正の対象とした.
                                    .
                                    .
Kj6BFix Ver.2
--------------------------------------------------------------------------
広辞苑第6版(EPWING版)に存在する説明文の誤り,および,音声アドレス
の間違い(辞書のバグ)を修正する.
                                    .
                                    .
修正の対象となるバグ
●『あしや』の説明文の間違い
(誤)
①兵庫県南東部の市。阪神間の高級住宅地。もと精道村の大字の名。万葉集の菟
原処女(うないおとめ)、在原行平と松風・村雨の伝説などの舞台。人口9万1千。
(正)
①兵庫県南東部の市。阪神間の高級住宅地。もと精道村の大字の名。万葉集の菟
原処女(うないおとめ)の伝説などの舞台。人口9万1千。           
                                    .
●『オオヨシキリ』の音声アドレスの間違い
  (誤)[000002DD:0008]
  (正)[000002DE:0008]
                                    .
                                    .
ファイル
・kj6bfix.exe   実行ファイル  [Windows コマンドプロンプト]
・kj6bfix.txt   ドキュメント
                                    .
                                    .
プログラムの処理概要
1.指定された辞書ファイルをコピーする.
2.コピーした辞書ファイルに修正を加える.
  ・本文内の項目,および,音声アドレスを検索
  ・オオヨシキリの音声アドレスを発見したら,修正する.
    [000002DD:0008] ==> [000002DE:0008]     (16進)
    00 00 07 33 00 08 ==> 00 00 07 34 00 08 (BCD)
  ・項目『あしや』の中に,"、在原行平と松風・村雨" を発見したら,
   この文字列を削除する.
  ・バグを発見できなかった場合は,何もしない.
3.処理結果をログファイル(kj6bfix.log)に出力する.
                                    .
                                    .
使い方
(辞書ビューアEBWinと付属のEBShrinkを使う場合の例)
1.辞書本体 honmon2 の圧縮を解除する.
  honmon2 ===> honmon.org  (EBShrinkで伸長)
  honmon2 ---> honmon2.bak (バックアップ)
                                    .
2.修正プログラムを適用する.
  kj6bfix honmon.org honmon.fix
       ↑元辞書  ↑新辞書名
                                    .
    入力:honmon.org   <-- 元の辞書
    出力:honmon.fix   <-- 修正された辞書
       kj6bfix.log  <-- ログ
                                    .
3.修正辞書を,honmon に改名して,EBWin に再登録する.
  honmon.fix ---> honmon (rename)
  "辞書の追加" で,EBWinに再度登録する.(catalogs変更不要)
  ※問題がある場合は,catalogs を適切に変更する必要がある.
                                    .
                                    .
注意
・このプログラムは,広辞苑第6版専用です.
・厳しい制限のある「ことといLight」の使用は想定していません.
                                    .
                                    .
●Kj6Bfix Ver.2 のダウンロード
 ダウンロードページ
 ===> http://lxdic.cocolog-nifty.com/blog/download.html
                                    .
                                    .
[HP200LX/LXDIC]

|

2016年1月 8日 (金)

広辞苑第6版(EPWING版)のバグ その2

■広辞苑第6版(EPWING版)のバグ その2
第5版では,数十点の能面の画像が全く使用されず,放置されている.
 ・項目『能面』の本文からの参照なし
 ・図版メニューからの参照なし
                                  .
第6版では,約50点の能面の画像が使用されているが,本文のみで参照され,
図版メニューからは参照されない.(一種のバグ)
 ・項目『能面』の本文からの参照あり.約50点の写真画像表示.
 ・図版メニューからの参照なし
  図版メニュー ===> 図・写真
         ===> 生活・風俗・芸能
         ===> 遊戯・人形・玩具・面
本来,図版メニューは,本文で参照された写真/イラスト等を分野別に分類して,
一覧表示するものであり,これに能面の画像が登録されていないとすれば,それ
は辞書作成上のミスである.(辞書のバグ)
                                  .
                                  .
(辞書のバグ3)
図版メニューに登録すべき,能面の写真画像約50点が登録されていない.
したがって,図版メニューからは,能面の写真画像を参照できない.
                                  .
                                  .
参考
LXDICによる『能面』の本文表示(総ページ約1100行を3分割表示:先頭部)
Noumen1
                                  .
[HP200LX/LXDIC]

|

2016年1月 7日 (木)

広辞苑第5版の未使用画像

■広辞苑第5版の未使用画像
広辞苑第5版の未使用画像は,いったい何の画像なのだろうか.
画像ファイルから,当該画像をJPEGファイルとして切り出し,調査する.
                                  .
JPEG切出しプログラム
画像変換プログラムに多少の変更を加えて作成
未使用画像のみを切り出す.

●調査結果
未使用画像の内訳(合計726点,18MB)
・カラー写真 :250(動植物などの写真)
  動物 :36
  植物 :37
  工芸品:71
  面  :79    ※1
  その他:25
・イラスト/図:476(動植物等のイラスト,地図など)
  動植物:約390   ※2
  図  :約70
                                  .
※1:能面の写真
・第5版の項目『能面』の本文記事には,画像へ参照が全くない.
 写真画像を用意しながら,参照しないのは不自然.バグか.
・図版メニューからも,能面写真への参照はない.
                                  .
※2:イラスト
・第5版では,鳥/植物/動物/昆虫等は,カラー写真になっている.
 不要になったイラスト画像が,残存しているようだ.
(第6版では,カラー写真とイラストの両方を使うようになった)
                                  .
●未使用画像のサンプル
写真
Kj5pic1b
                                  .
イラスト
Kj5pic3b
                                  .
[HP200LX/LXDIC]

|

2016年1月 6日 (水)

広辞苑の画像数に関するメモ

■広辞苑の画像数に関するメモ
広辞苑第6版の音声ファイルに,95件の未使用音声が含まれている事
を考えると,画像ファイルにつても,同様の状況にあると考えるざるを
得ない.
広辞苑 第5版,第6版の画像数を再点検した.
                                .
●プログラム(画像コンバータ)によるカウント結果
以下の画像数には,図版・表組,カラー・モノクロ写真の他に,数式の
画像,漢字書順の画像,図版メニューの背景画像等が含まれる.
なお,漢字の拡大図は,honmon内にあるモノクロ図版であり,ここでは
計算から除外している.(honmong内の画像が対象)
                                .
広辞苑 第5版
 画像の総数 :10291
 使用画像数 :9565
 未使用画像数:726 <--- 問題あり※
 ※未使用画像数が全体の約7%にもなり,問題がある.
  モノクロ変換後のサイズで,約9MB大きくなっている.
  102MB(未使用画像あり)<==> 93MB(未使用画像削除)
                                .
広辞苑 第6版
 画像の総数 :10399
 使用画像数 :10371
 未使用画像数:28  <--- 問題なし※
 ※数が少なく,問題はない.
                                .
[HP200LX/LXDIC]
                                .
●広辞苑第6版の未使用画像例
画像番号4464 (使用される画像)
Img04464
 
画像番号10337 (未使用画像)
Img10337
 
LXDICの本文表示画像 (項目『パンゲア』) 
Img_hon
      
[HP200LX/LXDIC]                          .

|

2016年1月 4日 (月)

広辞苑第6版:バグ発見の経緯

■広辞苑第6版:バグ発見の経緯
HP200LXで利用するため,広辞苑第6版の音声を,サイズの小さい第5版形式に
変換したのだが,バグはこの変換処理の過程で発見された.
                                    .
PCM音声コンバータの処理概要
・音声変換
 1.音声ファイル内のWAVEヘッダーを検索し,個別音声情報を取得する.
   音声情報を元に,変換処理を行ない,新しい音声ファイルに保存する.
 2.変換前後の音声アドレスを保存する.(新旧アドレス変換表)
                                    .
・アドレス書換
 1.本文内の音声アドレスを全て検索し,新旧アドレス変換表に従って,
   該当アドレスを,新しいアドレスに書換える.
 2.音声アドレスの使用状況の統計をとる.
                                    .
上記のアドレス書換の際に,以下の不整合が発見された.
1.本文内の音声アドレスで,新旧アドレス表に無いものが存在する.
  4件
   ==> 本文内の音声アドレスが4箇所間違っている.
   --> ログから本文内の位置を特定して,すべてが『オオヨシキリ』の
     音声アドレスである事を確認.
   --> 音声ファイルの解析から,正しい『オオヨシキリ』の音声アドレス
     が判明.(2048バイトのずれがある)
2.新旧アドレス表に,本文内から一度も参照されないアドレスがある.
  95件
   ==> 音声ファイルに95件の未使用音声が存在する.
   --> 全ての音声を,WAVEファイルとして切り出し,第5版のクラシック
     音楽94曲と鳥の鳴声1件である事を確認.
                                    .
[HP200LX/LXDIC]

|

«広辞苑第6版用PCM音声コンバータ