phpでファイルBOM (Byte Order Mark)データを削除するプログラム
ファイル名:clear_bom.php
phpコード:
<?php
if (!empty($_GET['dir’])){ //ファイルディレクトリを設定
$basedir=$_GET['dir’];
}else{
$basedir = '.’;
}
$auto = 1;
checkdir($basedir);
function checkdir($basedir){
if ($dh = opendir($basedir)) {
while (($file = readdir($dh)) !== false) {
if ($file != '.’ && $file != '..’){
if (!is_dir($basedir."/".$file)) {
echo “filename: $basedir/$file “.checkBOM(“$basedir/$file")." <br>";
}else{
$dirname = $basedir."/".$file;
checkdir($dirname);
}
}
}
closedir($dh);
}
}
function checkBOM ($filename) { //checkBOM定義関数
global $auto;
$contents = file_get_contents($filename);
$charset[1] = substr($contents, 0, 1);
$charset[2] = substr($contents, 1, 1);
$charset[3] = substr($contents, 2, 1);
if (ord($charset[1]) == 239 && ord($charset[2]) == 187 && ord($charset[3]) == 191) {
if ($auto == 1) {
$rest = substr($contents, 3);
rewrite ($filename, $rest);
return (“<font color=red>BOMが見つかった、自動的に削除.</font>");
}else {
return (“<font color=red>BOMを見つかった.</font>");
}
}else return (“BOMが見つかりません.");
}
function rewrite ($filename, $data) {
$filenum = fopen($filename, “w");
flock($filenum, LOCK_EX);
fwrite($filenum, $data);
fclose($filenum);
}
説明:
1.BOMは16進数で「FEFF」という16ビットの値で、誤ったエンディアンで読み込むと、これが「FFFE」となる。BOMが「FFFE」となった場合には逆のエンディアンを使って読み込めば正しく読み込むことができる。
2.resource opendir ( string $path [, resource $context ] )
ディレクトリハンドルをオープンします。このハンドルは、この後 closedir(), readdir(), rewinddir() 関数コールで使用されます。
3.file_get_contents()はファイルの内容を文字列に読み込む 方法として好ましいものです。OSがサポートしていれば パフォーマンス向上のためにメモリマッピング技術が使用されます。