さよなら無職

40歳のうちに あと数日で41歳になります。41歳を目前にして就職先が見つかりました。就職先は数十人規模のベンチャーです。前職よりちょっと規模が小さいのですが、すでに大手企業をクライアントに抱えて、きちんと利益を出しているというところがすごいです…

トレンドワード抽出をちょっと変更。Jumanも使ってみる

1ツイート内での名詞はユニークにしてカウントする 以前から簡単なトレンドワード抽出をやっているのですが、いろいろ変な語が混ざってきます。2012年1月16日のベスト10を出してみると、次のようになっていました。 逐逐 61.0 TORE 58.0 土蜘蛛 44.0 INFOBAR…

tweetstreamをOAuthで

BASIC認証からOAuthにするソースコード修正はわずか 以前、tweetstreamを使ってTwitter Streaming APIにアクセスすることを試しました。その後、ツイートをログファイルに残すようにしたものの、認証方式はBASIC認証のままにしていました。OAuthというものが…

トレンドワード抽出をちょっとまともに

寒い 今年は節約のために暖房を使っておらず、換気のために窓を開けていることも多いので寒いです。身も心も懐も……。今年は就職できるといいんですけれど、なかなか厳しいです。 名詞から「RT」の削除 これまでに何度も出ているように、ツイート名詞の収集す…

元日の頻出名詞とトレンドワード

元日の頻出名詞 元日の頻出名詞を見てみました。さすがにいつもとは違います。 トレンドワードを抽出したい ともあれ、これらの名詞の頻度は絶対値なので、「RT」とか「こと」とか常に上位に入っている名詞がやっぱり上位にあります。 それよりもトレンドワ…

jqPlotでグラフ表示

iPadでプログラミング 大掃除をすることもなく年末を過ごし、年が変わる前に布団に入り、年が変わってしばらくして吐き気と腹痛で起床しました。食あたりだと思うのですが、食あたりになるといつも手足が冷たくなる(ように感じる)のに、顔からは冷や汗のよ…

system()にフォーム入力を突っ込むのはやめておく

未来の自分は信用できないわけで。今年の汚れは今年のうちに。 昨日は面倒になってしまったので危ないコードを書いてしまったのですが、公開サーバではないとは言え、さすがにやめようと思いました。ぼーっとして危険だってことを忘れて公開してしまうかもし…

ツイート名詞から特定の名詞の出現頻度変化を見る

年末恒例の「徹子の部屋」ゲストはタモリさん 前回書いたように、12月28日の「徹子の部屋」のゲストはタモリさんなので、その日のツイートでは「タモリ」「徹子」といった名詞の出現頻度が多そうです。 特定名詞の出現頻度を見るための入力フォーム この出現…

ツイート名詞頻度表示をいじる

チェックボックスでフィルタリング有無を指定 昨日も書いたように収集ツイートから名詞を抽出し続けています。今日の「徹子の部屋」のゲストは年末恒例のタモリさんなので、ツイートの中の「タモリ」「徹子」の順位が上がるかなあ。楽しみです。で、名詞とし…

クリスマスイヴツイートのちょっとした謎

ツイート頻度ランキングトップ10の名詞? 先日からツイートを収集しています。そして、そのツイートからMeCabが名詞として判定したものを出現頻度順に並べるというところまでは自動的に毎日実施するようになっています。でも、前後処理をちゃんとやってない…

キーボード(HHK)

僕は十年以上キーボードにはHappy Hacking Keyboard、トラックボールはMS Trackball Explorerを使っていたのですが、今年の夏に有線接続がイヤになり、Apple Wireless Keyboard (US)とApple Magic Mouseという組み合わせに変えました。最初はなかなか慣れず…

PHP初体験

いまさらの積み上げ 生駒日記を巡っていると、戦うウェブエンジニアの三種の神器という記事を見つけた。さらにそこからのリンクを辿った。 Wannabeにならないように,というところが胸に刺さる いたたたた………。僕は、ならないように、というより40年間ワナビ…

Jubatusを使ってみようとしたけれど失敗

この日記は結局うまくいかなかった状況を書いているので、良い子は真似しないでください。悪い子は真似してもいいですが、うまくいかなくても怒らないでください。 Jubatusって とくに広告系やマーケティングなんかの仕事では、トレンドを掴むことが重要(だ…

布団を買った

全然関係ないんですけど、布団を買いました。昨日届きました。これまでうちには布団がなかったのです。秋までは羽毛布団があったのですが、十数年使って汚かったので捨ててしまいました。 昨日までは3つ折りマットレスの上に敷きパッド、掛け布団がないので…

Ruby 1.9.2でMeCabを使う

MeCabで形態素解析 ツイートなんかを分析したいのなら、まずは形態素解析しなきゃオハナシにならないでしょ、と。たとえば「僕は杉山です。」って文を形態素っていう単位に分けて、その形態素の情報を得る、と。形態素の情報っていうのは読み方だとか品詞だ…

ツイート収集その後(運用へ)

Twitter Streaming APIでのストリーミング切断 ツイート収集スクリプトが止まってしまう件は、tweetstreamの中でリコネクトできないというようなエラー表示でした。その後も同様に停止したのですが、3時に開始したものが5:39に停止していたので、長時間接続…

日本で2番目に大きなタイ焼き

全然関係ないのですが、近所になでしこジャパンの丸山桂里奈さんが住んでいます。先日、桂里奈さんのブログで日本で2番目に大きな鯛焼きというものが紹介されていました。 近所のお店だったので、私も購入してきました。そのお店での一番大きなサイズの鯛焼…

Twitter Streaming APIを試す

TwitterのStreaming API TwitterのStreaming APIを使ってみたくなりました。 Streaming APIというのは、まあその名前通りなのですが、ツイートがストリーミングされてくるAPIです。 大規模データで遊んでみたい 私は前職で音声認識用の統計的言語モデル(こ…