― MozillaZine.jp フォーラムは Mozilla 製品に関する情報交換の場です ―



All times are UTC + 9 hours

新しいトピックを投稿する トピックへ返信する  [ 20 件の記事 ]  ページ移動 1つ前へ  1, 2
作成者 メッセージ
投稿記事Posted: 2015年5月10日(日) 21:06 
再び横から失礼します。

「特定フォルダのみ」という表現にとらわれていたため、前便では実体ファイルに注目して書いてしまいましたが、新たに提示された情報に基づき、個々のメッセージに着目した別の観点から書かせていただきます。

tbユーザー さんが書きました:

を拝見すると、
 Content-Type: text/plain; charset=ISO-2022-JP
の文字セットに対して、
 Content-Transfer-Encoding: quoted-printable
のエンコーディングがおこなわれることが、原因になっている可能性が考えられます。

この点は kiki さんからもご指摘がありますが、標準的には、
 Content-Type: text/plain; charset=ISO-2022-JP
の文字セットは元々 7bit コードなので、そのまま
 Content-Transfer-Encoding: 7bit
となるのが普通です。

quoted-printable でエンコーディングするのは絶対ダメというわけではありませんが、日本語の文字セット(ISO-2022-JP)に対する変換効率の悪さや相手方の環境条件によっては表示に問題が生じるなどの理由から、普通はおこなわないと思います。理屈の上での組み合わせは可能でも、現実的な組み合わせかどうかは別問題、ということですね。
たとえれば、蕎麦(ISO-2022-JP)をスプーン(quoted-printable)ですくって食べて悪いわけではありませんが、普通は箸(7bit)を使うでしょう。「ISO-2022-JP + quoted-printable」の組み合わせでメールを送るのは、「蕎麦+スプーン」の組み合わせで相手に食べろと勧めるようなもの、といえるかもしれません。
どうしても quoted-printable でなければならない事情があるのかもしれませんが、積極的にやっていいこととは思えません。

一方、Thunderbird の [メッセージを検索] において、
 Content-Type: text/plain; charset=ISO-2022-JP
の文字セットに対して、
 Content-Transfer-Encoding: quoted-printable
でエンコーディングされた文字列を正常に検索できないケースがあることが知られています。
(メッセージ本文は文字化けせずに読めると思いますが、検索機能に難があるということのようです。)

もしも、「特定フォルダ」というのが、特定の差出人からのメッセージを分類したもので、その差出人からのメッセージが 100 %、
 Content-Type: text/plain; charset=ISO-2022-JP
 Content-Transfer-Encoding: quoted-printable
の指定になっているのであれば、「特定フォルダのみ本文検索ができない」という現象が起こる可能性は十分考えられると思います。

文字セットとエンコード方式の組み合わせを比較検証すると、
 Content-Type: text/plain; charset=ISO-2022-JP
 Content-Transfer-Encoding: base64
あるいは、
 Content-Type: text/plain; charset=UTF-8
 Content-Transfer-Encoding: quoted-printable
のメッセージは、[メッセージを検索] で本文を正常に検索できますので、ISO-2022-JP と quoted-printable の組み合わせに限っての問題のように見えます。

quoted-printable でエンコーディングされた日本語を正常に検索できないのは、Thunderbird(日本語版?)の問題だと思います。
同時に、送信側が最も標準的な文字セットとエンコード方式(ISO-2022-JP + 7bit)の組み合わせで送ってくれば、受信側で検索できない問題は起こらないともいえます。そういう意味では、変則的な組み合わせで送ってきた側にも問題はあるように思われます。

もし「ISO-2022-JP + quoted-printable」が原因で起こっている検索の問題なら、現状の Thunderbird でできるのは [グローバル検索] で代用するぐらいしか思いつきません。
どうしても「特定フォルダ」に含まれる語句を検索したいなら、「特定フォルダ」のメッセージを他のメールソフトでインポートして、そのメールソフトで検索をかけるという方法も考えられます。フリーのメールソフトで一例を挙げれば、Sylpheed などがあります。これなら簡単に Thunderbird のメッセージをインポートでき、「ISO-2022-JP + quoted-printable」に対する検索も可能です。

とりあえず以上です。的外れなことを書いていたらすみません。

(補足)
検索において「ISO-2022-JP + quoted-printable」と「ISO-2022-JP + 7bit」のメッセージに対する動作の違いは、実際にテストしてみるとわかりやすいと思います。

検索できないメッセージのひとつを選択し、[メッセージ] -> [新しいメッセージとして編集] または右クリックから [新しいメッセージとして編集] を実行すると、そのメッセージの件名と本文を(引用形式ではなく)そのまま拾ってメッセージ作成ウィンドウが開きます。(元のメッセージにいっさい影響はありません。)
そのまま何も加工せず、単純に下書きとして保存します。
保存された下書きメッセージは、Thunderbird の設定に基づいた文字セットとエンコード方式に変換されているはずです。日本語の標準設定なら「ISO-2022-JP + 7bit」です。
[下書き] フォルダを検索対象として、その保存したメッセージ本文に含まれる文字列を検索してみてください。
元のメッセージでは検索できなかった文字列が、こちらでは検索できると思います。

_________________
Mozilla/5.0 (Windows NT 6.2; WOW64; rv:37.0) Gecko/20100101 Firefox/37.0


通報する
ページトップ
  
引用付きで返信する  
投稿記事Posted: 2015年5月11日(月) 11:26 
引き続きお願いいたします。

kiki さんが書きました:
そもそも本文検索できないメッセージ本文は、Thunderbird 上できちんと読めるのでしょうか?
 #IMAP 上の同期でも、ローカルフォルダに置いたものも両方ともです。
メッセージ本文は下記画像の通りで、問題なく読むことができます。


IMAPアカウントでもローカルフォルダでもまったく同じに表示されます。

kiki さんが書きました:
これに関連した確認方法のアドバアイスが、先に 偶然的通行人 さんからありました。
ぜひ、試した結果を教えてください。
偶然的通行人 さんが書きました:
このようなケースなら、検索機能それ自体の問題というよりは、検索対象の実体ファイルに問題が起こっていると考えたほうがいいかと思われます。
そのあたりを点検するための簡単なテストとして、その「特定フォルダ」を対象に、半角英数文字(ASCII 文字)だけで [メッセージを検索] を実行するとどうなりますか。
例えば、本文内に書かれている URL に含まれる "http" の文字列で本文を検索するといった条件で検索結果が正しく出るなら、さしあたって検索機能に本質的な問題があるとは考えにくくなります。
これまでに何度か注文したことのある商品の商品番号(数字のみで構成される)で本文検索を行ったところ、正しく検索されたようです。
(その商品を注文した時の注文確認メール、出荷案内がヒット)
また、"http:"で検索したところ、お知らせメール、注文確認、出荷案内いずれもヒットしました。

偶然的通行人 さんが書きました:
実際に検索できなかったキーワードが何かわかりませんが、ASCII 規格以外の文字コードで扱われるものだと想像されます。差し支えのない範囲で、実際に検索できなかったキーワードを例示していただくと、このフォーラムを見ているみなさんに tbユーザー さんのところの事情が、今よりは見えてくるのではないでしょうか。
実際に検索できなかったキーワードは"ご案内"(注文確認と出荷案内のメールにのみ含まれる)、"。"(句点、全てのメールに含まれる)です。

kiki さんが書きました:
・Content-Transfer-Encoding: quoted-printable となっているので、明らかにメッセージの本文エンコード形式が異なる。
 差出人側のシステムの仕様が違うのかな?
・Avast! スキャンは、誰が、どの時点でやっているのかな?
両方とも私には解りかねます。すみません。
Avast!については、常駐保護-メールシールドをONにしています。

kiki さんが書きました:
【補足】
念のためですが、Thunderbird のセーフモード起動や新規プロファイルでも再現するか確
認しておくといいかも知れません。
 #アドオンやプロファイルが破損しているなどの問題を抱えている可能性もあるため
セーフモードで起動し本文検索を行いましたが改善は見られませんでした。
新規プロファイルを作成して該当のgmailアカウントにリンクさせ、本文検索を行いましたが改善は見られませんでした。

_________________
Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.135 Safari/537.36


通報する
ページトップ
  
引用付きで返信する  
投稿記事Posted: 2015年5月11日(月) 11:38 
申し訳ありません、トピック内が複数ページになっていたことに気付かず、偶然的通行人様の書き込みを見落としてしまいました。
一つ上の書き込みに追加する形で書かせていただきます。
偶然的通行人 さんが書きました:
もし「ISO-2022-JP + quoted-printable」が原因で起こっている検索の問題なら、現状の Thunderbird でできるのは [グローバル検索] で代用するぐらいしか思いつきません。
どうしても「特定フォルダ」に含まれる語句を検索したいなら、「特定フォルダ」のメッセージを他のメールソフトでインポートして、そのメールソフトで検索をかけるという方法も考えられます。フリーのメールソフトで一例を挙げれば、Sylpheed などがあります。これなら簡単に Thunderbird のメッセージをインポートでき、「ISO-2022-JP + quoted-printable」に対する検索も可能です。
他のメーラを使用したり、あるいは問題のメッセージは全てテキストファイルやcsvに保存してしまうなど考えましたが、
多少見づらくともグローバル検索できるならそちらで良いかなという気もしてきました。

エンコーディングの組合せ以外に問題が無く、Thunderbird側ではどうしようもないというのであれば、
そろそろこのトピックは閉めさせていただこうと思います。


通報する
ページトップ
  
引用付きで返信する  
投稿記事Posted: 2015年5月11日(月) 20:29 
オフライン

登録日時: 2006年9月05日(火) 18:47
記事: 4207
 
検証した結果を報告いただき、ありがとうございました。

整理すると、以下になるでしょうか。
・メッセ―ジ本文は読めている(IMAP 同期上もローカル上も)
・半角英数字の文字列(ASCII 文字)は検索できるが、全角文字列(日本語など)は検索でき
 ない
・Thunderbird のセーフモード起動や新規プロファイルでも再現する

となると、ISO-2022-JP + quoted-printable の組み合わせのメッセージで起きている問題に
なりますね。
このトピックの当初のタイトルにある「特定のフォルダ」ではなく、「特定のメッセージ」で
検索できないということですね。

Bugzilla で、quoted-printable search をキーワードにして検索したところ、次の 2 つがヒッ
トしました。
これが関係しているのではと思われます。

[参照]
Bug 667854 – Local body search does not work if the body contains quoted-printable like string("=" followed by two hexa decimal digits)
Bug 481616 – Local searching message fails when "=" is in the body, because quoted-printable text is searched as plain text even though "=" is encoded as "=3D" if quoted-printable (local search only, not IMAP online search)


Content-Type: text/plain; charset=ISO-2022-JP
Content-Transfer-Encoding: quoted-printable
という条件ならば、すべて同様の現象になるとは限らないようなので、ややこしい問題のよう
です。
当方の受信メッセージの中にも同様のものがありますが、本文検索できています。
 #とある大手企業のメールシステムから発信されたメッセージです。
  ISO-2022-JP + 7bit のメッセージも多数あります。
 #わざわざ ISO-2022-JP + quoted-printable の組み合わせにする必要性が
  何なのかは疑問に感じますが、その理由まではわかりません。
  改行とか、1 行あたりの文字数制限?システムの都合か仕様?


現状では、メッセージ自体はちゃんと読めるが、[メッセージを検索] 上だけの問題なので、グ
ローバル検索で代用するぐらいしか私も思い浮かびません。

_________________
Mozilla/5.0 (Windows NT 6.1; rv:40.0) Gecko/20100101 Firefox/40.0


通報する
ページトップ
 プロフィール  
引用付きで返信する  
投稿記事Posted: 2015年5月14日(木) 00:30 
グローバル検索で代用することにしようと思います。
長らく貴重なお時間を割いてお付き合いいただきまして、ありがとうございました。m(_ _)m

_________________
Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.135 Safari/537.36


通報する
ページトップ
  
引用付きで返信する  
期間内表示:  ソート  
新しいトピックを投稿する トピックへ返信する  [ 20 件の記事 ]  ページ移動 1つ前へ  1, 2

All times are UTC + 9 hours


オンラインデータ

このフォーラムを閲覧中のユーザー: Google [Bot] & ゲスト[156人]


トピック投稿:  可
返信投稿:  可
記事編集: 不可
記事削除: 不可
ファイル添付: 不可

検索:
ページ移動:  
Powered by MozillaZine.jp® Forum Software © phpBB Group , Almsamim WYSIWYG
Japanese translation principally by ocean