ほぼPython

Not技術ブログBut勉強ブログ 内容には誤りがあることが多いです

バズりそうなツイートを検索するWebアプリを作った

今日は時間があったので、ちょっとバズってる、あと少しで一気にバズりそうなツイートを検索するWebアプリを作りました。

作ったサイト:ぷちばず検索

 

 動機:

・バズりそうなツイートを見つけて早いうちにパクツイしたい

ツイッターで高度な検索すればこういうことはできないことはないがめんどくさい。

特徴:

・画像やURLが含まれるツイートは除外。(画像付きにすると企業などのツイートが多く含まれてしまったため)

・最大50件表示する。

残念な点:

・検索に時間がかかる。(最大20秒くらい)

・すぐAPI制限にひっかかる。(15分以内に合計12回検索されたら15分止まる)

→この点は改良済み キャッシュを使いAPI制限は回避(追記)

・UI, UXについては全く工夫してない。

 

↑を文章で書くと・・・

 

ツイッターでも高度な検索を使えば、いろいろと検索できますが、高度な検索は入力文字数が多く、面倒だし、英語のスペル忘れるし(?)、なかなか活用できていないので、pythonでやろうと思い、作りました。

 

バズりそうなツイートを検索したい」と思ったのが事のはじまりで、最新ツイートのうち、RTが50くらいあれば、バズりそうだなぁという考えのもとコードを書きました。

 

スマホから見れないと意味がないのでFlaskとHerokuも使って(一応)Webアプリ(と呼べるのか?)にしました。

 

APIの仕様を詳しく調べてないので詳しくはわからないですが、検索ワードが無いと検索できないっぽかったので、いくつかの助詞を検索ワードにしました。バズるようなツイートは、ある程度長めの文章が多く、ほとんどの場合助詞が含まれているだろうと思ったからです。

 

ただ、実際に検索してみると企業のツイートや芸能人のツイートなど、あまりおもしろくないツイートが多く引っかかってしまったので、画像とURLが含まれているツイートは除くようにしました。

 

すると、本来のツイッターらしい(?)文章だけでRTを稼ぐような面白いツイートをいくつか発掘することに成功しました。

 

しかし、検索にかかる時間がすごい遅いのと、結構すぐにAPI制限かかってしまうのが残念です。(一応API KEYを2つ回すように少し工夫はした)

 

また、herokuは30分(数字はうろ覚え)アクセスが無いと休眠状態に入ってしまうため、30分ぶりにアクセスしようとした人はトップページにすら重くて時間かかると思います。あと、本当はAjaxで検索待ちのときグルグルさせようと思ったのですが、まぁ(実質)自分用だしいいか、といった感じです。

 

バズりのタネのツイートはかなり価値あると思うので、ある程度理想のものが作れて満足です。今後も退屈なことはPythonにやらせようと思います(読んだことない)

 

ぷちばず検索

 

ちなみにソースはこちら