開発支援

  • Amazon.co.jp
    開発支援を希望する方は、上のリンクを通してAmazonでお買い物をすると、私にいくらかの開発費が入る……はずです。
  • Amazon欲しいものリスト
    ひっそりと欲しいものリストを作ってみました。リストを眺めるのも結構楽しいですよね。

最近のトラックバック

ようやくゲットしましたよ

無料ブログはココログ

« 「ボーンズ&カーズ」Ver1.2.13公開 | トップページ | HTMLでログ公開!Ver20100210公開 »

青空昆布Ver1.5公開

 久しぶりに青空文庫のファイルを変換してみてビックリ。エラーが出て止まるじゃないですか。
 エラーメッセージをみてさらにビックリ。

 ShiftJisの文章がLatin1と区別が付いてない!(Latin1の文章はOK)
 という訳で、今回の更新は

・ShiftJisの文章が変換できない不具合の修正。
 結局、一度文字コード判別させて、失敗したらもう一回S-Jisだけで判定させてみることに。
・コマンドライン出力に変換中の文章を何の文字コードと判別したかを表示。
 未対応文字コードの時はascii扱いになったりするので判ります。

 となっています。
 詳しい使い方はReadmeをご覧ください。

「青空昆布 Ver1.5」をダウンロード

 なお、不具合報告や感想などお待ちしています。
 今回の不具合にしても、報告があれば、もっと対応が早かったんですけどね……。

« 「ボーンズ&カーズ」Ver1.2.13公開 | トップページ | HTMLでログ公開!Ver20100210公開 »

青空昆布(aozoraconv.pl)」カテゴリの記事

コメント

PSPのブラウザでテキストを読む際、「▽」を押していくのが不便で、青空昆布は「○」でページ送りが出来るという機能に惹かれ、さっそく使用してみました。結果、読むのがとても楽になりました。目にもやさしい配色で快適に読書できます。とても便利なツールをありがとうございます。

ただいくつかのテキストファイルで、変換するとhtmlの文字が文字化けしている場合があるのですが、メモ帳のテキストを文字コードANSI(Shift-JIS)をUTE-8に変換して青空昆布で変換すると文字化けしないでhtmlになります。その際、先頭の文章に「?」がついてきます。
perlとか全くわからないのでなにがいけないのかわからず唸っています。


 ご愛用ありがとうございます。
 色設定を弄るのは簡単なので、是非気に入ったコーディネートが出来たら教えてください。

>ただいくつかのテキストファイルで、変換するとhtmlの文字が文字化けしている場合がある

 実際に、そのテキストを見てみないと確かなことは言えませんが、ShiftJisにもいくつか「方言」があるんです。
 おそらく、その方言の一つで書かれていて拡張された文字が使われているのではないでしょうか?
 例えば「ローマ数字(IIIとかIVとか)」が一文字になったような奴や○の中に数字が入っているものなんかがそうだったはずです。
 もしも青空文庫のテキストだった場合は、「そのテキストがどれか」を教えて貰えると対処できるかも知れません。

# おそらくCP932だろうなとは思うのですが、今度は「全角チルダ、波ダッシュ問題」が邪魔なんですよねw


>先頭の文章に「?」がついてきます。

 メモ帳で変換すると「?」がつくのは「文章の最初の行」だけで「行の頭」でしょうか?
 もしもそうならBOMの問題でしょうかね。
 メモ帳じゃなくて、適当なテキストエディタで変換すると直るかも知れません。
 私は「サクラエディタ」( http://sakura-editor.sourceforge.net/ )を愛用していますが、このエディタは拡張子ごとに色設定なんかを弄れて面白いですよ。

さっそくのご返信ありがとうございます。
「?」がつくのは青空昆布で変換したhtmlです。文章の最初のタイトルの前にだけ「?」がひとつ付きます。青空文庫のテキストではないweb小説をコピペしたものです。
試しにサクラエディタで保存したらきちんと青空昆布で変換されました。これからはこちらで保存していこうと思います。

htmlに変換して文字化けしたのは「丸数字」と「波線」でした。
丸数字をやめて、波線は「下がって上がる形」に置換してUTE-8で保存したテキストを青空昆布で変換しています。htmlの波線は「上がって下がる形」で表示されました。
page0000.htmlの「行の頭」に「?」がついてきます。

「全角チルダ、波ダッシュ問題」、検索しました。文字化けについて色々知ることができました。む、難しい。

 UTF-8とCP932のマッピング問題は「どっちが間違ってる」と断定しにくいのがまた難問ですよねw
 ともあれ、Ver1.6を公開しましたので、是非お試しください。

 不具合があったら、また是非お知らせくださいねw

この記事へのコメントは終了しました。

トラックバック


この記事へのトラックバック一覧です: 青空昆布Ver1.5公開:

« 「ボーンズ&カーズ」Ver1.2.13公開 | トップページ | HTMLでログ公開!Ver20100210公開 »

TRPG用ツール関連リンク

  • ActivePerl
    ActiveStateのWindows用Perl処理系ActivePerlのサイト。英文。
  • COM Meets Ruby
    Windows用Ruby処理系の一つActiveScriptRubyのサイト。
  • TRPG支援ツール@Wiki
    2ch卓上ゲーム板TRPG支援ツールスレWiki
  • どどんとふ@えくすとりーむ
    Ruby+Flashの高機能オンセツール「どどんとふ」の公式サイト。プレイ会場もあるのでお試しもOKです。私のB&Cが丸ごと入ってます。
  • ターミナルベロシティ
    IRCオンラインセッション界でデファクトスタンダードなダイスボットOD-Toolが公開されているWiki。ぶっちゃけ国産TRPGのフォローアップはOD-Toolの方が良いですw

よく行くサイトさん

  • TRPG SNS
    TRPGに特化したSNS。利用は無料で、どどんとふの半公式コミュもあります。
  • TRPG.NET Wiki
    IRCサーバでお世話になっているTRPG.NET上にある、TRPG関係の包括的?Wiki
  • ten-youの日記
    JavaScriptでLimeChatのマクロ作りに余念がない“ten-you”さんのブログ。DX2用決定版マクロはここから出るかも?!
  • あかまんぼう
    アイコンなどのグラフィックス関係で多大な協力をしてくれている“なかやまさき”さんのブログ
  • お店番ブラウの控え室
    TRPG仲間にして、グラフィック担当の“白瀬 北斗”氏のブログ。内容はTRPGと無関係な罠。
  • きまぐれTRPGニュース
    有名なTRPG関係ニュースのまとめサイト。新製品から論考まで幅広く網羅されています。
  • ひきだしの中身blog
    CoCの伝道師かつ作家かつ美味い物スキーの“内山 靖二郎”氏のブログ。
  • ぽち*ぷ~ち
    怒濤のLinux使い“犬山ぽち丸”さんのサイト
  • トリスメギストスラボ
    三賢者の研究所でしょうか?絵が描けてTRPGが出来る“xing”さんのサイト。デザインが綺麗だなぁ。
  • パルテストラーダ
    “Regulus”さんのArsMagicaのサイトです。人のことは言えませんけど、マニアックですよね(笑
  • 大槌ぶんぶん
    ウォーハンマー翻訳チームの方のブログ。「どどんとふ」の竹流さんの友人だそうです。凄い人は凄い人と繋がってるものですね。
  • 来ヶ!たいたいキングダム 4th Destructor
    Ruby使いの“来山 竹流”さんのブログ。メインは「ど@えむ」に移行したので、こっちはTRPGと開発の話?!
  • 迷いの森
    私はもっぱらブログを読んでる“雪だるま”さんのサイト

こんなの読んでます