― MozillaZine.jp フォーラムは Mozilla 製品に関する情報交換の場です ―



All times are UTC + 9 hours

新しいトピックを投稿する トピックへ返信する  [ 6 件の記事 ] 
作成者 メッセージ
投稿記事Posted: 2017年1月31日(火) 13:32 
オフライン

登録日時: 2008年2月22日(金) 13:00
記事: 43
お世話になります。
ImportExportToolsというアドオンを使って、別のメーラーで吐き出したmboxファイルのバックアップをとりました。
その結果、主にヘッダー情報に以下のような記載があるメールがことごとく文字化けしました。
Content-Type: text/plain;charset="Shift_JIS"
Content-Transfer-Encoding: 8bit

膨大な数のメールがあるため、すべてを確認したわけではありませんが、その他の文字コードのメールは概ね正しく表示されているようです。
文字化けしてしまったメールは異なる文字コードに変更しても正常化しませんでした。
なにか他に事後的に正しく表記させる方法はないでしょうか。
なおmboxファイルはまだ残っているので、事前に文字コードを変換することなどは可能かもしれません。
よろしくお願い致します。

Thunderbird version: 52.01b1
OS: Windows 7 Professional, SP 1

_________________
Mozilla/5.0 (Windows NT 6.1; rv:51.0) Gecko/20100101 Firefox/51.0


通報する
ページトップ
 プロフィール  
引用付きで返信する  
投稿記事Posted: 2017年2月01日(水) 07:25 
hoyajit さんが書きました:
ImportExportToolsというアドオンを使って、別のメーラーで吐き出したmboxファイルのバックアップをとりました。

「別のメーラーで吐き出したmboxファイル」(=バックアップファイル?)を、ImportExportTools を使って Thunderbird 52.0b1 にインポートした(取り込んだ)、という意味でしょうか?

hoyajit さんが書きました:
その結果、主にヘッダー情報に以下のような記載があるメールがことごとく文字化けしました。

インポートが失敗したというエラーメッセージも出ず、Thunderbird 52.0b1 へのインポートは完了したが、取り込み後のメールを閲覧したところ、仰る条件のメールが文字化けしていたというお話ですよね。

hoyajit さんが書きました:
文字化けしてしまったメールは異なる文字コードに変更しても正常化しませんでした。

これは、当該メールに対し、Thunderbird の [表示] -> [テキストエンコーディング] の値を [日本語 (Shift_JIS)] にして、Content-Type の指定条件に合わせても、文字化けが解消されなかった、ということですよね。

hoyajit さんが書きました:
Thunderbird version: 52.01b1

Thunderbird 52.0b1 はベータ版です(後述)。

上述の事柄に留意しつつ、現状で気になった点をいくつかコメントさせていただきます。

(A)「別のメーラーで吐き出したmboxファイル」というのは、具体的にどんなメールソフトから、どんな方法で取り出したものですか。
いまの時点で詳細はわかりませんが、「吐き出した」段階では、データ内部に異常がなかったことは確認できていますか。
確実に mbox 形式のファイルなら、直に Thunderbird に認識させることはできませんでしたか(mbox にはバリエーションがありますが...)。

(B)Thunderbird 52.0b1 はベータ版です。
Daily や Earlybird よりは安定していますが、開発版であることに変わりはありません。とくに、52.0 はテキストエンコーディングまわりにも変更が入っていますので、正式対応が明言されていないアドオンが、52.0b1 との組み合わせで正常に動作するとは限らないことにご留意ください。
当方の Windows 7 上にある Thunderbird 52.0b1 で、Shift_JIS のメッセージを作って自分宛に送受信した限りでは、メッセージ作成、下書き保存、送信控え、受信の全段階で、"文字化け" は起こりませんでした。簡単なチェックしかやっていませんが、52.0b1 上で作成・送受信したメールデータの Shift_JIS に関しては、取り扱いに問題がある、といったことは見出せませんでした。

(C)ImportExportTools のバージョンは何ですか?
現時点で AMO にあるのは 3.2.4.1(2015 年 9 月リリース)で、
https://addons.mozilla.org/ja/thunderbi ... porttools/
「動作環境: Thunderbird 1.0 - 45.*」と表示されています。
Thunderbird 52.0b1 で強制無効化されるようなことはないのかもしれませんが、動作上、予期しない問題が起こる可能性は否定できません。
作者のページ
https://freeshell.de/~kaosmos/importexporttools-en.html
には 3.2.5 がありますが、2016 年 3 月のリリースです。時期的にみて、Thunderbird 52.0 はまだ Nightly 版さえ存在していません。

(D)"文字化け" したメールのサンプルをご提示ください。またソースをご確認ください。
ひと口に "文字化け" といってもパターンに違いがあります。当該メールを選択したとき、メッセージペインにどんな文字列が表示されるのでしょうか。
内容的にまずい部分は出さなくてかまいません。"文字化け" していて判断し難いと思いますが、オープンにして差し支えない部分だけでもご提示いただけると、具体的な状況が他者に伝わります。
[Ctrl] + [U] で開くソースウィンドウで、[表示] -> [テキストエンコーディング] の変更も試してみてください。とくに、[日本語 (Shift_JIS)] を選んだときの状態です。

(E)「別のメーラーで吐き出したmboxファイル」がまだ残っているなら、そのファイルをテキストエディタで開いてみることはできるでしょう。
その際、文字コードを切り替えてファイルを読み込み直せるテキストエディタを使うことで、その mbox ファイル内に各メッセージデータの状態を確かめられると思います。
例えば、Shift_JIS で開いたとき、「Content-Type: text/plain; charset="Shift_JIS"」のメールの本文部分が文字化けせずに読めるなら、少なくとも「別のメーラーで吐き出したmboxファイル」内の「Content-Type: text/plain; charset="Shift_JIS"」なメールのデータに問題はないと考えられます。
同様に、UTF-8 で開いたときは「Content-Type: text/plain; charset="UTF-8"」なメールの本文部分が、ISO-2022-JP で開いたときは「Content-Type: text/plain; charset="ISO-2022-JP"」なメールの本文部分が、文字化けせずに読めるはずです。

もし、(E)で「別のメーラーで吐き出したmboxファイル」に問題はないことがわかれば、次に疑わしいのは、ImportExportTools でのインポート時だといえるでしょう。
Thunderbird 45.7.0 + ImportExportTools 3.2.4.1 の組み合わせで「別のメーラーで吐き出したmboxファイル」をインポートして問題が起こらないのなら、hoyajit さんがお使いの Thunderbird 52.0b1 + ImportExportTools(バージョン不明)の組み合わせに問題があるのかもしれません。

とりあえず気がつくのは以上です。的外れな話だったらすみません。


//【お知らせ】2017 年、Firefox の大きな変化にご注意 ////////////////////////////
・Firefox の各機能サポート終了予定(2017年)について | Mozilla Japan ブログ
https://www.mozilla.jp/blog/entry/10571/
//////////////////////////////////////////////////////////////////////////////////
*ブログ記事は Firefox のものですが、ほとんどが Thunderbird にも当てはまります。

_________________
Mozilla/5.0 (Windows NT 6.1; WOW64; rv:51.0) Gecko/20100101 Firefox/51.0


通報する
ページトップ
  
引用付きで返信する  
投稿記事Posted: 2017年2月01日(水) 13:24 
オフライン

登録日時: 2008年2月22日(金) 13:00
記事: 43
偶然的通行人さま、ご回答ありがとうございました。
おたずねの点、以下の通りお答えいたします。
言葉たらずについてはどうぞご容赦ください。

> (A)「別のメーラーで吐き出したmboxファイル」というのは、具体的にどんなメールソフトから、どんな方法で取り出したものですか。
> いまの時点で詳細はわかりませんが、「吐き出した」段階では、データ内部に異常がなかったことは確認できていますか。
> 確実に mbox 形式のファイルなら、直に Thunderbird に認識させることはできませんでしたか(mbox にはバリエーションがありますが...)。
>
mboxファイルをを出力したメーラーはGmailです。GoogleのTakeout機能を使用しました。
データ内部に異状があったかどうかの確認はしていません。
ダウンロードした圧縮ファイルを展開し、件のアドオンを使用してThunderbirdのローカルフォルダにインポートしました。
アドオンを使用せずにmboxファイルをどのように認識させるのか不明ですが、当該ファイルをそのローカルフォルダにドラッグしても何も起きませんでした。
GmailならIMAPを使えば良いというご見解もあると思いますが、都合により今回の方式をとっております。
mboxに出力したメールはGmailではすでに削除しており、あらためてアーカイブを取り出すことはすでに不可能となっております。


> (B)Thunderbird 52.0b1 はベータ版です。
>
承知しております。ただこの問題は去年の夏にはすでに発生しておりましたので、正式版でも生じる問題ではないかと認識しております。

> 当方の Windows 7 上にある Thunderbird 52.0b1 で、Shift_JIS のメッセージを作って自分宛に送受信した限りでは、
> メッセージ作成、下書き保存、送信控え、受信の全段階で、"文字化け" は起こりませんでした。簡単なチェックしかやっていま
> せんが、52.0b1 上で作成・送受信したメールデータの Shift_JIS に関しては、取り扱いに問題がある、といったことは見出せませんでした。
>
自作で試したことがないので詳細は不明ですが、種々に異なる文字コードを持つメールが複数含まれるmboxファイルを読み込む際に一部のデコードを失敗するのではないかという推察は可能です。


> (C)ImportExportTools のバージョンは何ですか?
>
3.2.4.1 です。
ご指摘を受け、すべてはこの問題につきるかと拝察いたします。


> (D)"文字化け" したメールのサンプルをご提示ください。またソースをご確認ください。
>
以下のような文字列が表示されます。
・ス・ス・ス
一部を取り出したものなので正常表示で何が書かれていたかは現在では不明です。
文字コードは「Shift_JIS」となっておりました。
他のコードに変更しても、正しく表示されることはありませんでした。


> (E)「別のメーラーで吐き出したmboxファイル」がまだ残っているなら、そのファイルをテキストエディタで開いてみることはできるでしょう。
>
TeraPadで開くことは可能ですが、文字コードを変更したり一部を改編しても保存できませんでした。
新規保存した場合は、Thunderbird側で認識不能となります。

> Thunderbird 52.0b1 + ImportExportTools(バージョン不明)の組み合わせに問題があるのかもしれません。
>
ご指摘の通りかと存じます。
このアドオンを使用してのインポートの件は断念したいと存じます。
もしその他のインポート法をご存知でしたらぜひご教示のほどをお願い致します。
どうかよろしくお願い致します。

_________________
Mozilla/5.0 (Windows NT 6.1; rv:51.0) Gecko/20100101 Firefox/51.0


通報する
ページトップ
 プロフィール  
引用付きで返信する  
投稿記事Posted: 2017年2月01日(水) 21:21 
オフライン

登録日時: 2011年7月14日(木) 22:59
記事: 547
横から失礼します。
使用環境が
hoyajit さんが書きました:
mboxファイルをを出力したメーラーはGmailです。GoogleのTakeout機能を使用しました。
データ内部に異状があったかどうかの確認はしていません。
ダウンロードした圧縮ファイルを展開し、件のアドオンを使用してThunderbirdのローカルフォルダにインポートしました。

ということなので、実際にShift_JISのメールをGmailのアカウントに送って、Takeoutで該当メールを含むmboxファイルを作成・ダウンロードし、ImportExportTools3.2.4.1でインポートする操作を行ってみました。

結論から言うと、ImportExportToolsが原因ではなく、Gmail側のエクスポートに問題がありそうな結果になったので、以下検討結果を書いておきます。

【検証環境】Windows8.1+Thunderbird45.7.0
【検証手順】
  1. Gmailの受信トレイにあるメールを複数(Shift_JIS*1通、ISO-2022-JP*2通、UTF-8*2通)用意する
  2. これらについて、
    A)Thunderbird上でImportExportToolsを使ってmboxファイルにエクスポート
    B)GmailのTakeout機能を用いてmboxファイルにエクスポート・ダウンロードする
  3. 上記で作成したmboxそれぞれを、ImportExportToolsを用いてローカルフォルダにインポートする
  4. A)、B)それぞれのメールについて文字化けの有無を比較
A)とB)それぞれに含まれるメールの内訳は同一のものです。
結果は、A)については5通いずれも文字化けせず正常に本文の表示が出来ました。
B)については、ISO-2022-JPやUTF-8のメールは問題なく正常に本文が表示されましたが、Shift_JISについては文字化けしてまともに表示が出来ませんでした。

A) のメッセージソース(必要部分のみ抜粋)
コード:
Date: Wed, 1 Feb 2017 20:24:38 +0900
User-Agent: Mozilla/5.0 (Windows NT 6.3; WOW64; rv:45.0) Gecko/20100101
Thunderbird/45.7.0
MIME-Version: 1.0
Content-Type: text/plain; charset=Shift_JIS
Content-Transfer-Encoding: 8bit

シフトJISでGmailに送ってみる
テスト用本文
(ここから)


B)のメッセージソース(同範囲を抜粋)
コード:
Date: Wed, 1 Feb 2017 20:24:38 +0900
User-Agent: Mozilla/5.0 (Windows NT 6.3; WOW64; rv:45.0) Gecko/20100101
Thunderbird/45.7.0
MIME-Version: 1.0
Content-Type: text/plain; charset=Shift_JIS
Content-Transfer-Encoding: 8bit

・スV・スt・スgJIS・ス・スGmail・スノ托ソス・ス・ス・ストみゑソス
・スe・スX・スg・スp・ス{・ス・ス
(・ス・ス・ス・ス・ス・ス・ス・ス)

B)については、他のメール環境(Sylpheed)にも読ませてみましたが、やはりまともに表示は出来ませんでした。

Thunderbirdのベータ版ではなく、安定板における簡単な比較検討ですが、上記結果からは
hoyajit さんが書きました:
自作で試したことがないので詳細は不明ですが、種々に異なる文字コードを持つメールが複数含まれるmboxファイルを読み込む際に一部のデコードを失敗するのではないかという推察は可能です。

の可能性は否定的で、
hoyajit さんが書きました:
> Thunderbird 52.0b1 + ImportExportTools(バージョン不明)の組み合わせに問題があるのかもしれません。
>
ご指摘の通りかと存じます。
このアドオンを使用してのインポートの件は断念したいと存じます。
もしその他のインポート法をご存知でしたらぜひご教示のほどをお願い致します。
どうかよろしくお願い致します。

アドオンのせいでもなく、最初のGmail側のエクスポート時点で正常に行えていない印象です。

_________________
Thunderbirdの基本を書いています(ずっと発展途上) とりかごとなり。
基本の操作(画像あり):バージョン確認 / セーフモード / 新規プロファイル作成
Mozilla/5.0 (Windows NT 6.3; WOW64; rv:51.0) Gecko/20100101 Firefox/51.0

通報する
ページトップ
 プロフィール  
引用付きで返信する  
投稿記事Posted: 2017年2月02日(木) 07:35 
当方からの問いかけにお答えいただき、ありがとうございました。> hoyajit さん
詳しい検証をしていただき、ありがとうございます。> meeyar さん

meeyar さんが書きました:
アドオンのせいでもなく、最初のGmail側のエクスポート時点で正常に行えていない印象です。

もともと、日本語メールの中でも Shift_JIS は少数派ですから、Gmail のような世界規模のサービスの中ではさらに少数派ということになろうかと思います。
Google Takeout の動作が、このレアなケースの対応に不具合を含んでいる可能性は十分考えられそうです。

hoyajit さんが書きました:
ただこの問題は去年の夏にはすでに発生しておりましたので、正式版でも生じる問題ではないかと認識しております。

Thunderbird 45.x 系でも起こっていたということですか?
仮に 2016 年 7 ~ 8 月ごろだとすると、52.0 はまだ Nightly さえ出ていなかったと思います。
そのころなら、45.2.0 ~ 45.3.0 といったあたりでしょうか。

「去年の夏」以前は、Thunderbird + ImportExportTools の組み合わせで、Shift_JIS のメールも正常にインポートできていたということなら、「去年の夏」ころに Google Takeout に何らかのバグが入り込んだのかもしれませんし、hoyajit さんがそのころ初めて Google Takeout をお使いになったのなら、それ以前から Shift_JIS の処理に不具合があったのかもしれません。

hoyajit さんが書きました:
以下のような文字列が表示されます。
・ス・ス・ス
meeyar さんが書きました:
・スV・スt・スgJIS・ス・スGmail・スノ托ソス・ス・ス・ストみゑソス
・スe・スX・スg・スp・ス{・ス・ス
(・ス・ス・ス・ス・ス・ス・ス・ス)

半角カタカナが随所に現れるという見た目の印象でいえば、Shift_JIS のデータが誤って EUC-JP で展開されたときの化け方に似ているようですが、それだけではないようにも見えます。

hoyajit さんが書きました:
アドオンを使用せずにmboxファイルをどのように認識させるのか不明ですが、当該ファイルをそのローカルフォルダにドラッグしても何も起きませんでした。

mbox ファイルを Thunderbird 上にドラッグ&ドロップしてもインポートはできません。

Thunderbird のプロファイルはご存知かと思います。
・Thunderbird のプロファイル | Thunderbird ヘルプ
https://support.mozilla.org/ja/kb/profi ... -user-data

(一例 -- [受信トレイ] の実体ファイル)… [ ] はフォルダ
[xxxxxxxx.default]
 └ [Mail]
   └ [Local Folders]
      └ Inbox ……拡張子のないファイル(受信トレイの実体)

この Inbox が mbox 形式のファイルで、[受信トレイ] 内の全メッセージを内包しています。

Google Takeout でダウンロードしたデータの中の mbox ファイル、つまり ImportExportTools でインポート対象として指定したファイル(仮に名前を gmailbak とする)を、上記の Inbox と同じ階層に配置して、Thunderbird を起動したらどうなりますか?
もし、Thunderbird が gmailbak を mbox ファイルとして認識したら、起動した Thunderbird の [ローカルフォルダ] 配下の [受信トレイ] と同階層に、[gmailbak] というフォルダが表示され、それを選択すると右上のスレッドペインにメッセージ一覧が表示されるはずです。
[gmailbak] フォルダが表示されないか、表示されてもスレッドペインに一覧表示できないなら、プロファイル内に置いた gmailbak ファイルは、Thunderbird が直接認識できる mbox ファイルではないのかもしれません。つまり、Thunderbird 的には不適切な mbox ファイルということになります。

現時点では、
(a)Google Takeout でダウンロードしたエクスポートデータに問題が起こっていた
―― が主原因である可能性が一番大きいと思いますが、
(b)問題のある(a)を ImportExportTools でインポートしたとき、さらに問題がこじれた
―― という二段構えのトラブルである可能性も否定はできないと思います。
  上述のように、Google Takeout でエクスポートした mbox ファイルを直接 Thunderbird に認識させられれば、そのあたりの切り分けもできるのではないでしょうか。

hoyajit さんが書きました:
なにか他に事後的に正しく表記させる方法はないでしょうか。

もし Google Takeout のエクスポート時点で問題が起こっていたのであれば、インポート後の Thunderbird 側でどうにかできる問題ではありませんから、残念ながらほかの方法はないと思います。

とりあえず以上です。

_________________
Mozilla/5.0 (Windows NT 6.1; WOW64; rv:51.0) Gecko/20100101 Firefox/51.0


通報する
ページトップ
  
引用付きで返信する  
投稿記事Posted: 2017年2月02日(木) 12:16 
オフライン

登録日時: 2008年2月22日(金) 13:00
記事: 43
meeyar様
偶然的通行人様

さまざまご対応いただき本当にありがとうございました。
偶然的通行人様のご教示に従って、プロファイルフォルダ中にmboxファイルを置いてみましたが、フォルダとしての認識はできましたが、やはり当該のメールは化けたままでした。
また、mboxファイルをemlファイルに分割してインポートを試みたり、その他のメーラー(Becky, EdMax)を使用してインポートしたりしましたが、結局正常に表示することはできませんでした。
Googleが吐き出すmboxファイル自体に、Shift_JIS / 8bit のデコードを失敗させる不具合が含まれるのかもしれません。
ちなみにこのコードは一見したところ、@softbank.ne.jpから送られたメールにのみ認められるようでした。
しかし、なぜか他のコード(例えば、Shift_JIS / base64)を付随させたメールもあり、この場合は正常に表示されています。

いずれにせよ、デコード失敗の主因はGoogle由来のmboxファイルにあるようです。
確認せずに元メールを削除してしまったことを悔やみつつ、今後の参考にしたいと思います。

色々とご検証ご教示いただきありがとうございました。
今一度感謝の言葉を申し上げ、本件は解決とさせていただきたいと存じます。

_________________
Mozilla/5.0 (Windows NT 6.1; rv:51.0) Gecko/20100101 Firefox/51.0


通報する
ページトップ
 プロフィール  
引用付きで返信する  
期間内表示:  ソート  
新しいトピックを投稿する トピックへ返信する  [ 6 件の記事 ] 

All times are UTC + 9 hours


オンラインデータ

このフォーラムを閲覧中のユーザー: なし & ゲスト[104人]


トピック投稿:  可
返信投稿:  可
記事編集: 不可
記事削除: 不可
ファイル添付: 不可

検索:
ページ移動:  
Powered by MozillaZine.jp® Forum Software © phpBB Group , Almsamim WYSIWYG
Japanese translation principally by ocean