マルチリンガル情報処理技術に関するシンポジウム(1996年3月25日〜26日)非公式報告

(新部 裕 氏(gniibe@mri.co.jp) によるメモ)

March 25

Opening Remarks (Shuichi Tashiro)

(1)Dao-yuan Hu, Hai-feng Zhu, Shi-Quan Yao (China (PRC))

* 中国のインターネットの現状と展望について説明があった。 金橋衛星, CERNET などについて紹介。
* 文字コードとしては 10646 を使っていく方向で GBK (K は拡張と言う意味 だそうです)という 20902 種の文字を持つコードが最近開発された。Windows '95 で使うことができるようにする方向。
* 情報交換の仕組みとしては, ISO-2022-CN, ISO-2022-CN-EXT という 7bit の encoding の方式が提案されている。
* アプリケーションとしては Windows 上の RichWin (GBK を利用), Orpheus 1.0b (Multimedia Chinese E-mail System) がある。
(2) V.K. Samaranayake, S.T. Nandasara (Sri Lanka)
* スリランカではタミルとシンハラの二つの言語があるのだそうで, そのうち シンハラ語とそのコンピュータでの取り扱いについての解説が行なわれた。
* シンハラの writing system では基本的には left to right だが, modifier とかを書いていくのに, 上いったり下いったりする。その実現が難 しい。
%コメント% どうも, その手で書く writing system に対応させて computer 上で, 文 字の要素を character の code point に対応させることを考えている模様。 うーむ。そりゃ, 漢字だって部首を character とすれば, 上いったり下いっ たりするがな。
* で, グリフはいくつくらいかというと 50x40 でおおよそ 2000.
* 入力のためには 65 の element.
LUNCH

(3) Masataka Ohta (Japan)

* 「プレインテキスト」について, なぜプレインテキストか, プレインテキス トとはなにか, それはどのように表現されるのかについての発表。
* プレインテキストは有限状態オートマトンで認識できるもの ...というのを 定義としたい。
* Stateless の固定長の表現を考えた場合, 以下の情報は character code に エンコードする必要がある。
- アラビア語のように語の先頭か後尾か中かで形が変わるものはその情報
- 方向
(4) Soo Youn LEE (Korea)
* KS5601 では 2350 種の字しかサポートされていなかった。新しい KS5700 では(Unicode なのかな?), 19x21x28 = 11172 の全部のハングル文字をサポー トしている。
%コメント% どうも Unicode の assign されていない領域を(勝手に?)使ってるよう。
(5) Rais Yatim (Malaysia)
* マレーシアの computer network と, それに関連した機関について説明があっ た。
* MIMOS (Malaysian Institute for Microelectronics O? System) の下に Juring と NITC (National Information Technology Council)というのがあるそうです。
%コメント% なんだかよくわからないが検閲の話になってしまった。
(6) Suchit Nanda, Sunil K. Singh (India)
*なんだったかなぁ?? Jawi とかいっていたような気がします。
BREAK

(7) Werner Lemberg (Austria)

* CJK TeX (韓国語, 日本語, 中国語が使える LaTeX のマクロパッケージ)に ついてその実現についての発表。
* JTeX, JLaTeX などと異なり, 普通の TeX から使うマクロパッケージとして の実現である。
* Mule の encoding を用いている。
%コメント% どうも Mule の leading character を TeX の active character に map することでフォントの切替を行なっているらしい。
(8) Valentin Shopov (Bulgaria)
* Delegate に入れて使う CII library に関しての発表。
* WWW の proxy で, テキストを bitmap に置き換える仕組み。
* サーバにフォントを用意しておくことで, フォントを持っていないクライア ントでも, ページを見ることができる。
Closing

RECEPTION (at Hotel Sun Route Tsukuba)


March 26

(9) Darmawan Sukmadjaja (Indonesia)
* Multilingual Machine Translation System (Chinese, Japanese, Thai, Malaysian, Indonesian の 5 ケ国語)についての発表。
* Interingua という中間表現を導入している。
%コメント% どれくらい使えるんでしょうねぇ。
(10) U Thuang Tin (Myanmer)
* Myanmer でのコンピュータ利用についての発表。
* Character Set の標準はまだない。
* AVA Font (Macintosh 用), Win Myanmer (Windows 用)というのが使われて いる。
(11) Khaver Zia (Pakistan)
%コメント% いきなりコーランで始まりました。終ったと思ったら, 次は英語でともうひ とうなり。
* Urdu はなんといっても書道のようなもので, 太さやひねりが重要だそうで す。
* 画面できれいに表示するには rendering の技術がとても大切。
* rendering の辞書を持つ方法, rendering の rule を持つ方法, 両方式の併 用の 3 種類がある。
* alphabet は 38 だが, ligature を考えると, 20,000 種程度の glyph が必 要。
LUNCH

(12) Tan Tin Wee, Leong Kok Yong, Ho Yean Fee (Singapore)

%コメント% なんだかよくわかりませんが, 製品の売り込み?
* シンガポールは英語, 中国語, タミルとマルチリンガルの需要がとても大き い。Unicode を使っていく。
(13) Tan Dang Cao, Thai Ba Tran (Vietnam)
* 650 characters で basic word が 7,000 words といっていたような気がし ます。
* Windows '95 for VN だそうです。
(14) Norbert Klein, Samphea Rul (Cambodia)
* Khmer では 2,400 くらいの glyph (? ligature?) が考えられる。
* パソコンショップごとに, keyboard/font が異なる。Mac と Windows では 違う。Standard を作ることが大切。
%コメント% どうにも keyboard, font という物理的なものに関心が行き過ぎの感あり。 Character code 決めなきゃでしょ?
* 135 種の key が必要になるので, Ctrl, Alt を組み合わせて入力する。 ア プリケーションが使うキーの組み合わせとぶつからないようにパッチを用意し たりしている。
%コメント% うーむ。直接入力するのもいいけど, インプットシステムを考えた方がいい ような気がするなぁ。
BREAK

(15) Mark R. Crispin (U.S.A.)

* Internet で multilingual というのをどう考えているかうんぬんという話 だったような気がします。
* 複数の character set でやるか一つの character set でやるか。
(16) Haruhisa Ishida (Japan)
* Internet の成長と市場という観点で見た場合, 英語以外の文化でのコンピュー タの利用はどうなのかな? という発表。
Closing Remarks (Shuichi Tashiro)

Closing


Back to Mule Homepage 日本語ホームページへ戻る