twitter無能

少し前に思いついたこと
暇なときがあればやりたい
え?まだ作ってないのにこんなところに書くと誰かが先に作ってしまうかもって?
それはそれでいいんじゃない?誰かが実装したくなるほどのアイデアを出せたんならそれだけでも満足だよ
そもそもおいらが思いつくようなレベルのことなので誰かが既にやってると思う


twitterを利用した人工無能
以下のことを行う
・人口無能と会話したい人がtwitterのアカウントでログインする
・ログインした人のタイムライン上のtweetを取得(フォローしてる人のtweetがとってこれる)
・RT, @hoge, http://hoge.hogeなどを除去
・頻出する部分文字列を取得
・それらをキーワードとしてどれかのtweetを元に応答文を生成


大体こんな感じ


利点
・頻出の部分の字列を取得するので非言語依存かつ, 砕けた表現にも対応可
・ユーザがフォローしている人の最近のtweetが元になるのでタイムリーかつ興味のある内容を持ってこれる


問題点
・品詞情報がないのでストップワードの除去やステミングが難しい
・応答文生成が難しそう
→抜き出したキーワードが名詞などの応答文の一部として有効に使えるものかがわからない
→品詞に基づく規則性を求めることができない, 単一ユーザのタイムラインから得られる情報だけでは規則性を見出しづらい(これは推測)などマルコフ連鎖をしづらそうな環境がそろってる


大体こんな感じかな