IRCの文字コード
実はとある友人の募集をみてビックリ。チャンネル名に半角カナが混じってるじゃありませんか。
日本でのIRCの文字コードは伝統的にiso-2022-jp(いわゆるJISコード)が採用されていますが、こいつには半角カナが割り付けられて無いのです。当然半角カナは使えません。
不正な文字を受け取った場合、どういう動作をするかは受け取るソフト任せです。
フールプルーフなソフトなら全角に自動変換したり、半角カナだけ別の文字コード扱いしたりと上手いこと対応してくれるのでしょうが、そうでないソフトもあります。
従って、IRCで半角カナを発言したり、半角カナのチャンネル名を作るのは文字化けなどの原因になるためやっちゃいけない訳です。
もちろん私のダイスボットもiso-2022-jpで半角カナを受け取ると内部で文字化けしてます(笑
実を言うと私は半角カナが大嫌いです。
電子メールの普及でようやく根絶かと安心したら、見事携帯のお陰で返り咲き。
まったく迷惑な話です。私だけかもしれないけど(笑
さて、最近国内IRC事情も国際化したのかハングルや中国語が読めないと不便な事になってきた様子です。
そのため、「UTF-8」を使うサーバ(やチャンネル)もポツポツと現れたようですね。
もともとIRCの規格では、送受信する文字コードが「8ビットオクテットを使う」ということしか決まっていませんので、文字コードの問題は付いて回りそうです。
とりあえず私が一番困るのはオンセ用のボットの送受信が文字化けする事なので、先にボット側の対応を行っておきました。
「文字コードの識別文字列って何?」ってな方も多分居るでしょうが、当分必要のないオプションですし、「iso-2022-jp」と「utf-8」以外が必要な方は、自分で調べた方が早い気がします。
なんせPerlで扱える文字コードは結構多いのだ(笑
« ウォーハンマーFRP第2版用ボットVer1.2公開 | トップページ | ウォーハンマーFRP第2版用ボットVer1.3公開 »
「IRC用ダイス&カードボット「ボーンズ&カーズ」(Perl)」カテゴリの記事
- cre系のIRCサーバがUTF-8に移行したようですね(2012.05.27)
- らぁさんの特殊ダイスサンプルコード(2012.05.26)
- 「ボーンズ&カーズ」Ver1.2.45公開(2011.09.11)
- 「ボーンズ&カーズ」Ver1.2.44公開(2011.09.05)
- 「ボーンズ&カーズ」Ver1.2.43公開(2011.08.27)
「困ったときには(FAQ)」カテゴリの記事
- どどんとふの接続ユーザが増えると重くなる訳は?(2015.04.17)
- B&C用に表のテキストを起こそうと思うのですが、どんな書式が良いですか?(2011.06.04)
- PPMにNET-IRCモジュールがない?!(2010.12.11)
- ActivePerlのインストールが判りません!(2010.01.10)
- このダイス、出目が偏ってませんか?(2010.01.06)
この記事へのコメントは終了しました。
« ウォーハンマーFRP第2版用ボットVer1.2公開 | トップページ | ウォーハンマーFRP第2版用ボットVer1.3公開 »
コメント