akismet の結果抽出

wordpress のコメントのDB (prefix_comments) から,comment_approved='spam' で抜ける.
なので,例えば…

select comment_author_IP,comment_author from prefix_comments where comment_approved='spam' order by comment_author_IP;

などと抜いて,
xlsでピボットテーブルを使って,頻度順に並べかえれば,特にアクセスの多いIPアドレスを抽出可能.

WordPressでMIME-TYPEをapplication/xhtml+xmlとする

-- きっとこれで終わる追記

本家のフォーラムで,
パッチを作ってもらえました.
えがった,えがった.
general-tempate.php に,linkタグの出力があったんだなぁ…

-- 追記

フォーラムで報告したところ,もう少しスマートな方法をご紹介いただいた.
でももう眠いので,また今度ためします.
フォーラムの該当記事はこちら→サイト内検索時のRSSフィードのURL出力について

-- 元の記事

これはハマった.

ちなみに,application/xhtml+xml は,IE8以前では認識されないため,IE8以前向けには出力していません.確認をしたい方は,firefoxとか使ってください.IE9もイイヨ.

症状
wordpressの出力のMIME-TYPEをapplication/xhtml+xmlとすると,サイト内の検索結果が表示されない.
原因
検索結果画面のlinkタグ内のURL内のセパレータに `&' ではなく,`&' が使われているため,XMLパースエラーを起こす.
対処
wordpressのインストール先ディレクトリを ``/wp_blog`` とした時に,
``/wp_blog/wp-includes/link-templete.php`` の L.796付近,及びL.825 付近 (wordpress 3.1.2 の場合) にある次のソース,
``$link = apply_filters('search_feed_link', $link, $feed, 'posts');``
で出力されるURLが,他の部分と異なり `&' と出力すべきセパレータを, `&' と出力してしまう.
本来ならば,search_feed_link というキーで適用されるフィルタか何かを修正したいが,ソース内を検索しても見付からないので,このソースを該当行の次の行に埋め込むことで対処する.

  $link = str_replace('&','&',$link);
  ...(略)
  $link = str_replace('&','&',$link);

スパム増加

3月まで,月に100~200件だったスパムが,4月ではすでに4700件を越えてしまった.
ということで,アクセス制限かけまーす.
明らかなスパム投稿を繰り返すホストは弾きます.

ところで,IE9正式版出ましたね.
「Ctrl+E」→「アドレスバーでキーワード入力」→「"http:///? 検索キーワード" というURLへアクセスしようとしてエラー」
となるのは仕様なのかしら.

-- 追記
アドオン管理の検索プロバイダの設定で,「アドレスバーで検索」にチェックを入れれば使えた.
IE8までは,インターネットオプションの詳細設定からアドレスバーでの検索をオンにしておくと,変なアドレスに行きたい時に勝手に検索されて困っていたので,機能を殺していた.
妻のアカウントのIE9からは普通に検索できたため,上記の設定が引き継がれたのだと思われる.

e-taxで確定申告

基本的には,公式ページの方法に従って入力するだけ.
ただし,ちょっとハマった.

ICカードリーダ/ライタを導入後,e-Taxをご利用になる場合の準備等:平成22年分 確定申告特集にある「事前準備セットアップ」をインストールする.
全て終了後,設定は完全なはずなのに,何故かICカードの読み込みに失敗し,「HJS0407E」なるエラーコードが返された.
色々と試行錯誤したがうまくいかず…結局,再起動したら出なくなった.

あと,e-taxのページには,Windows 7 64bit版対応,とか書かれているが,事前準備セットアップのインストールパスを
見る限りはx86用のバイナリが導入されているっぽいので,32bit版IEでないと動かないのではないかと勝手に想像している.

-- 追記
データの送信を完了した.
医療費の入力が激しく面倒なので,合計金額だけ書いて,領収書を郵送しようかとも思ったが,せっかくなので今回はちゃんと入力してみた.
私の場,通常の還付申請のはずなのだが,源泉徴収で1度申請している生命保険等保険料の支払い金額と,実際の申請金額とに差があったため,確定申告Bで申請することになってしまった.
確定申告Aの用紙でも生命保険料を書けるんだから,還付申請の中でも入力させてよ…

e-Taxのいい点は,還付申請ではない申告になっても,確定申告の受付期間前に受け付けてくれること.
詳しくは,国税庁の平成22年分の所得税、消費税及び贈与税の確定申告についてを参照のこと.

Topsy Retweet Button で RT した時の文字化け解消

文字化けというか,URLエンコードされた文字列が,引用されてしまう現象.
Topsy Retweet Button のプラグインを WordPress で使っていると,
日本語のタイトルが次のように表示されてしまう現象があった.
「Topsy Retweet Button で RT した時の文字化け解消」→「Topsy%20Retweet%20Button%20%82%c5%20RT%20%82%b5%82%bd%8e%9e%82%cc%95%b6%8e%9a%89%bb%82%af%89%f0%8f%c1」

[WordPress] リツイートボタンを簡単に設置出来る Topsy Retweet Button | t011.org (←なぜか,Chromeだと落ちる) によれば,
設定画面で次のチェックを外すことで解消されるらしい.

Preload static retweet button before fetching count/badge data (Note: May cause raw "gibberish" code to appear in some themes; [see the Topsy plugin FAQ](http://wordpress.org/extend/plugins/topsy/faq/) for details.)

公式ページの FAQ によれば,
特定のテーマでは,PHP の関数の使い方の関係で,コードが表示されてしまうとか.
多分,テーマのファイルを修正したら直るんじゃないだろうか.
で,これをオフにした影響としては,個別記事ページではない複数記事を表示しているページで,
RT 件数が表示されなくなることのようだ.
(追記:ちゃんと表示されました)
hadacchi blog の場合は,元より RT されることは稀なので,気にしないことにする.

リファラの収集

このblogに,どこから人が来ているんだろう,どんな検索キーワードで来てるんだろう…
と思って,アクセス解析のプラグインを入れてみた.

入れたのは次の3つ.

  • Blog Stats by W3Counter
  • Woopra
  • WassUp

ちょっとしか使ってないけど,感想はこんな感じ.

Blog Stats by W3Counter
シンプルで使い易い.凝ったことしないなら,これで十分.
Woopra
重い.なんかjavascriptがエラー吐いたので削除した.ログ見るのに手間かかるような代物はいらない.
WassUp
ダッシュボード(管理画面のこと)にグラフが出るのが,視覚的に楽しい.

referer はそのほとんどが windows 7,しかも x64 に関連する設定やエラーについての検索結果から.
googleのシェアが意外と低かった.
今,Windows 7 で proxy の設定を調べると,この blog の記事(windows7 で proxy の設定)がトップに出てくるのが原因のようだ.
もーちょっと,ちゃんと書いてるページを参考にした方がいいと思うけどなぁ…

ついでに,先の記事の補足.
ウィルス対策ソフトでproxy関連でエラーが出ていて,この設定しても直らないと書いている人がいた.
例えばSymantecの場合,手動のLive updateの場合はIEの設定を使用,とすればproxyをきちんと使ってくれるのだが,
定時アップデートの場合はLive update の中でわざわざ明示的に設定しないと接続失敗するので注意.

p_blogのフッターがIE互換表示にしないと表示されない場合の対処

hadacchi が運営していた旧blogの場合,IEやchromeで表示すると記事の箱が背景の箱から溢れてしまい,
blogの一番下に表示されるはずのシグネチャ等が表示されなかった.
CSSの属性が誤っていると思われる.

box要素のレイアウト
事象
divの中に複数列のbox要素を配置した場合,
外枠のdivの高さとして,HTML上で最後に登場する列のbox要素の高さの合計が適用されてしまい,
先に出てきたの列のbox要素の高さの合計が前述の高さよりも高い場合,要素が溢れてしまう.
その後ろに外枠の横方向に横断するbox要素が配置されていると,横に押し退けられてしまう.(右図参照)
対処
外枠(p_blogの場合,wrapper ID)のスタイルシートとして,次の指定を追加する.
max-height: none;

max-height: auto; という,誤った指定でも同じく解消されたので,
この属性がどこかでdivに対して指定されているのかも知れない…が面倒なんで確認しない.

QAサイトがサーチエンジンの結果に出ることが本当に増えた

ここでQAサイトと呼んでいるのは,「OKWave」「教えて!goo」「MSN相談箱」「Yahoo!知恵袋」のように匿名投稿の質問に匿名投稿で回答する形式のコミュニティのこと.
私はこの手のサイトが好きではない.
明らかに事実と異なる回答や信憑性のない回答がよくあって,しかもそのような情報がベストアンサー(Yahoo!知恵袋の制度)に選ばれていたりするためだ.
知ってる情報は調べる必要がないし,知らない情報は怖くて信用できない.
娯楽として楽しんだり,旅行の行き先のオススメのようなアンケート的なものは良い.
でも,医療健康関係の話題などは誤情報による事故が増えそうで恐ろしい…

そして何より困るのが,大量の提携サイト(QA Partner)があるため同じ質問がサーチエンジンの結果を埋めてしまうこと.
web テキストマイニングをしている人は言いたいこともあると思うが,一利用者としては不便で仕方ない.

firefox で特定のページにアクセスするとフリーズするバグ

このバグで困っていた→Bug 539391 - Firefox hangs when I open this website (CNET-Japan) on Windows 7 x64
で,このページ→RAVENZ NETWORK ::: BLOG EDITION : 解決!Firefox in Windows7でフリーズ問題 によれば,どうやらWin版Osakaフォントを導入した状態で,
Osakaフォントを指定しているページにFirefoxでアクセスすると起こるとのこと.

いざ,Osakaフォントを消して,リブートしてアクセスしたら…直りました.

なお, hadacchi は英語が不自由なのできちんとbugzillaで報告できませんでしたが…
このバグにでくわすと IE の proxy 設定が Firefox の user.js の一部で上書きされてしまい, win の色んなアプリがネットに接続できなくなったりします.

問題を抱えているのがOsakaフォントなのかFirefoxなのかは分かりませんが,とりあえず hadacchi は, Osakaフォントを外すことにしました.

IE8, Firefox用検索プラグインの作成&追加

いつの間にか,検索エンジンの追加の方法が変わっていた.
以前(Firefox 2.0の頃)は, Profile フォルダ以下の searchplugins フォルダへ検索エンジンのフォームデータについて記述した xml ファイルを保存して Firefox を再起動することで,検索エンジンを追加することができた.
その後,多少仕様変更が入り, Profile フォルダの search.json をいじれば追加できたように記憶していたのだが,現在(Firefox 3.5.7)では,この方法で検索プラグインを追加できなくなっていた.

どうやら現在は, IE も Firefox も, Opensearch とかいう記述を使わないといけないらしい.
IE用の検索プロバイダ作成ページがこれに従っているので, Firefox も同様にこのページから作れるのですが … アイコン変えたりとか凝った人は自作しましょう)

参考:
Creating OpenSearch plugins for Firefox - MDC

で,作ったプラグインを公開したいのも山々なんですが,検索エンジンによっては,検索プラグイン化が許されていないものがあります.
そういうサービスを IE や Firefox の検索フォームから呼び出したい時は,自己責任で自作してください.
具体例で言うと,私はかつて,「英辞郎 on the Web」の検索プラグインを作成して使っていたのですが,英辞郎 on the Webの規約が変更になったために公開できなくなってしまいました.

検索用のツールバーを入れろという検索エンジンも多いですが,検索キーワード入力後,Alt+Enter で別タブへ検索を表示したいので,自作プラグインは重宝しています.