このブログは更新を停止し、Reddit紹介ブログ「Redditへ行こう!」に移転中です
昨日、本気を出すと言ったように記事の製作を再開します。
前に
検索からコピペブログ(まとめサイト)と広告を出なくするソフトを製作する事に関して意見を募集しました。結論から言いますと一旦保留にして、別の作業を行います。
まずやるのはGoogleのニューストピックを表示しなくするFireFoxのアドオンを作る、あるいはGoogleのニューストピックを消す方法について記事にする事です。
一体どういうわけか、Googleのニューストピックにアフィブログ表示されるようになりました。
原因がわからない以上、その件に関して記事にするつもりはないのですが、とりあえず何らかの対処方法を考えなければなりません。
というわけで、このニューストピックを非表示にするアドオンをFireFoxで作ろうと考えています。技術的にはそう難しくないはずです。
何やらAdblockアドオンの一種であるμBlockで防ぐ事も可能らしいのですが、詳しいやり方が分かっていません。申し訳ありません。
次にやるのはアフィブログの収集方法について考える方法です。
実を言うと、ニュー速Rで「開発したいのだが、1人でやるのはきつい。」とスレを建てたところ、「すでに防ぐアドオンやローカルプロキシがある。それよりアフィブログやドメインを収集する方法について考えたい」という意見が多く集まりました。
今のところ、どうすればいいのかアイディアはないので、上の方を先に進めますが、方法について考えてみる事にします。
なお、綺麗な検索にはすでに2000件以上のアフィブログが登録されており、こちらの手元にはさらに約4000件以上のアフィブログの一覧(そのうち約半数がFC2とライブドア)があるのですが、どうやら精度が悪いようで、より質の高い一覧が必要な状態です。
とりあえず、意見は募集し続けます。関連記事の下に技術的にどのようにして行おうとしたのか書いておきます。プログラミング畑でない人以外には意味不明な内容だと思うので、読み飛ばしてください。(私の無知を晒すような事が書いてあるかもしれませんが・・・)
関連記事
検索からコピペブログ(まとめサイト)と広告を弾くソフトの意見募集広告と不快な検索結果をブロックできるソフト開発の進展状況と意見募集方法は所謂プロキシによるコンテンツフィルタです。プロキシを用いてサイトの中身を書き換えるのです。
このプロキシはかのRubyのWEBrickという物を用いれば簡単にできます。おそらく一週間もあれば作れるでしょう。しかし、問題が有ります。
・一々プロキシの設定をしないといけない点(この欠点を解消したプロキシを透過型プロキシという。RubyのWEBrickでは作れない)
・SSL通信を用いた(つまりURLにhttpsと書いてある)サイトの書き換えは全く出来ない点。
後者が最大の問題点で肝心のGoogleの書き換えが全く出来ません。正直な話、もしGoogleがこのSSL通信という余計な事をしなかったら、さっさと作っていました。
その後、結局諦めきれずに調べに調べたところ、MITMプロキシというSSL通信を書き換えられる技術を見つけました。
この技術を使っている物にMITMProxyというPythonで書かれたオープンソースの物があるのですが、基本的にMacとスマホとLinuxでしか動かないものでした。
ですが、このMITMProxyを改造してWindowsでも動くようにしたHoneyProxyという物があり、これをさらに改造して、作る予定でした。
[4回]