今も昔も変わらず文字化けに悩む人は意外と多いと思います。文字コードの誤変換結果一覧はその原因解析の参考になると思い、僕が直近でまとめた誤変換結果を一覧補湯としてまとめて公開することにしました。decodeで文字コードを間違えると完全に元の文字列に戻すことは容易ではないので最初が肝心ってわけですね!...
前回「vista で導入される jis x 0213:2004(jis2004) のまとめ(お勉強編)」という記事を書きましたが、本当に文字化けする文字について調査しました。僕は perl...
MySQLを使っている方の多くはデータベース管理ツールとしてphpMyAdminやAdminerをお使いのことでしょう。ただ極たまに文字化けに遭遇します。今回はutf8なデータベースにlatin1な文字コードで格納されている場合の文字化けの回避方法について紹介します。手抜き版なのでソースを改変しちゃう方法です。...
仕事で Windows の機種依存文字を代替文字へ置換するスクリプトを書くことになりました。書くの面倒くさいのでとりあえずググって見たんだけど見つかりません。仕方がないので手抜き実装だけど作りました。javascript実装なのでブラウザ側で置換するスクリプトです。...
Windows 版 Mecab で半角カナが混入していると、ある特定の文字が続く場合に形態素解析に失敗するようです。おそらくは SJIS の文字コードの 1byte 系と 2byte 系が混在した場合の切れ目判定まわりの不具合と思うんですが・・・...
アクセス数が多くなってくると、画像のアクセスがログだけで60〜70%の容量を占有し、ログ解析やdisk消費量で問題がでてきます。そんなときにはapacheであればmod_setenvifを旨く設定することでアクセスログの軽量化を実現することができます。その方法について説明していきます。...
innodb vs myisam vs falcon benchmarks - part 1 | mysql performance blog ってエントリをちょっと前にみて、myisam / innodb / falcon のパフォーマンスについて興味が沸いてきました。約一年前のエントリなので全体的に...
prototype.js を以前から使ってみたいと思っていたのですが、なかなか時間がとれなくて触ることができませんでしたが、必要に迫られて javascript のコーディングをすることになりました。良い機会なので...