MozillaZine.jp フォーラム
https://forums.mozillazine.jp/

文字エンコーディング自動判別
https://forums.mozillazine.jp/viewtopic.php?f=3&t=15488
ページ 11

作成者:  koshisako [ 2015年6月25日(木) 10:21 ]
記事の件名:  文字エンコーディング自動判別

38.0にしてから文字エンコ―ディングの自動判別語源が少なくなっています。
他の語源を増やす事は出来るのでしょうか?
ちなみに、日本語、ロシア語、ウクライナ語しか表示されません。

作成者:  偶然的通行人 [ 2015年6月26日(金) 19:16 ]
記事の件名:  Re: 文字エンコーディング自動判別

※質問するときは、「フォーラムの利用に関するご案内」、とりわけ「質問するときは」に目を通し、OS の種類や Thunderbird のバージョンといった使用環境についての最低限の情報を書き添えることをお勧めします。

おっしゃっているのは、Thunderbird のメインウィンドウにあるメニュー、
[表示] -> [文字エンコーディング] -> [自動判別]
の項目のことだと推測します。
([メッセージのソース] ウィンドウにも、同様に [自動判別] の項目はあります。)

Thunderbird 38.0.1 において、[表示] -> [文字エンコーディング] -> [自動判別] で開くサブメニューの項目は、
 (解除)
 日本語
 ロシア語
 ウクライナ語
―― の4種類なのはご指摘のとおりです。ただ、この表示は 31.0 の時点ですでにそのようになっていました。
koshisako さんが書きました:
38.0にしてから文字エンコ―ディングの自動判別語源が少なくなっています。

ということは、38.0.1 にする直前に使っておられたバージョンは、31.x 系ではなく、もっと古いバージョンだったということでしょうか...。

当方、ESR ベースでの使用なので、中間のバージョン(ベータ版含む)でどうなっていたかは知りませんが、少なくとも 24.x 系では選択肢がもっと多く複雑だったのは覚えています。

koshisako さんが書きました:
他の語源を増やす事は出来るのでしょうか?

それだけでなく、24.x 系にあったような [リストをカスタマイズ...] の設定項目もなくなっていますし、31.x 系では about:config に存在した項目も 38.x 系ではなくなっているものがあります。

ただし、[表示] -> [文字エンコーディング] -> [自動判別] に相当する設定項目は、38.0.1 の about:config に残ってはいます。

intl.charset.detector

日本語版 Thunderbird のデフォルト値は、ja_parallel_state_machine で、これは [自動判別] で [日本語] を選択したときの状態です。文字通り、対象を日本語の文字セットに絞った検出器の設定となります。

したがって、この設定項目の値を手動で書き換えれば自動判別の対象言語を変更することができる理屈になります。
(一例)
もし、24.x 系にあった [全言語] を対象にした自動検出を望むなら、値を universal_charset_detector にして、実際の動作を確かめてみてください。

しかしながら、実際に従来同様の働きをするかどうかは、確かめたわけではないので何とも申し上げられません。
Thunderbird の内部的な仕様が変更されている場合、about:config に設定項目が残っていても、旧来通りの動作になるとは限らないからです。

[自動判別] の項目を増やしたい理由などを具体的に説明していただければ、他のユーザーさんから解決策や代替策、その他の工夫などのアドバイスが寄せられるかもしれません。

(補足)
もともと、電子メールではデータを送受信する双方が、共通のルールに則ってやりとりすることが前提になっています。
文字セットや符号化方式など、どの規格を使ってメールデータを作成したか、送信側で明記してあるのが基本です。受信側はこの情報に基づいてデータを処理し、人間が読める文章、取り扱えるデータに戻します。

Thunderbird の [自動判別] は、(送信側の不備または経路上の問題などで)信頼性が低い情報しかない場合に、Thunderbird 側で把握できる条件から推測して文字データを表示するための機能です。なので、100 %の確実さで自動判別できるわけでありません。そのため個別の選択項目があります。
こういう機能ですから、自動判別に頼らなければならないメールが減れば(ルールに則った送受信が増えれば)、この機能の出番も減る理屈になります。

また、次のようなこともあります。
Thunderbird 38.0.1 のリリースノートには、変更点として「次の利用されることが稀な文字集合をサポートしなくなりました:(以下略)」とあります。
http://www.mozilla.jp/thunderbird/38.0.1/releasenotes/
大筋でいえば、電子メールをめぐる世界的な状況は時代とともに変化しているわけで、その流れの中で Thunderbird の仕様や機能も変化していく、ということでしょう。

一方、電子メールが扱うメインのデータはいまでも文字情報です。
多様な言語があり、一国で複数の公用語を持つ国もあり、国を超えた通信もおこなわれています。その国や言語ごとの特殊事情もやっぱり存在しますし、ユーザー固有の事情もあるでしょう。
ユニバーサルな方向性は基本方針として支持できますが、本質的にルールから外れた要求でない限りは、少数派のニーズにも対応できるだけの柔軟性が Thunderbird にあると嬉しい、とは思います。


シロウトが体験から得てきた知識で書いた話ですが、以上です。的外れだったらすみません。専門知識をお持ちの方からの訂正や補足を歓迎します。

ページ 11 All times are UTC + 9 hours
Powered by phpBB® Forum Software © phpBB Group
http://www.phpbb.com/