2011-12-01から1ヶ月間の記事一覧

system()にフォーム入力を突っ込むのはやめておく

未来の自分は信用できないわけで。今年の汚れは今年のうちに。 昨日は面倒になってしまったので危ないコードを書いてしまったのですが、公開サーバではないとは言え、さすがにやめようと思いました。ぼーっとして危険だってことを忘れて公開してしまうかもし…

ツイート名詞から特定の名詞の出現頻度変化を見る

年末恒例の「徹子の部屋」ゲストはタモリさん 前回書いたように、12月28日の「徹子の部屋」のゲストはタモリさんなので、その日のツイートでは「タモリ」「徹子」といった名詞の出現頻度が多そうです。 特定名詞の出現頻度を見るための入力フォーム この出現…

ツイート名詞頻度表示をいじる

チェックボックスでフィルタリング有無を指定 昨日も書いたように収集ツイートから名詞を抽出し続けています。今日の「徹子の部屋」のゲストは年末恒例のタモリさんなので、ツイートの中の「タモリ」「徹子」の順位が上がるかなあ。楽しみです。で、名詞とし…

クリスマスイヴツイートのちょっとした謎

ツイート頻度ランキングトップ10の名詞? 先日からツイートを収集しています。そして、そのツイートからMeCabが名詞として判定したものを出現頻度順に並べるというところまでは自動的に毎日実施するようになっています。でも、前後処理をちゃんとやってない…

キーボード(HHK)

僕は十年以上キーボードにはHappy Hacking Keyboard、トラックボールはMS Trackball Explorerを使っていたのですが、今年の夏に有線接続がイヤになり、Apple Wireless Keyboard (US)とApple Magic Mouseという組み合わせに変えました。最初はなかなか慣れず…

PHP初体験

いまさらの積み上げ 生駒日記を巡っていると、戦うウェブエンジニアの三種の神器という記事を見つけた。さらにそこからのリンクを辿った。 Wannabeにならないように,というところが胸に刺さる いたたたた………。僕は、ならないように、というより40年間ワナビ…

Jubatusを使ってみようとしたけれど失敗

この日記は結局うまくいかなかった状況を書いているので、良い子は真似しないでください。悪い子は真似してもいいですが、うまくいかなくても怒らないでください。 Jubatusって とくに広告系やマーケティングなんかの仕事では、トレンドを掴むことが重要(だ…

布団を買った

全然関係ないんですけど、布団を買いました。昨日届きました。これまでうちには布団がなかったのです。秋までは羽毛布団があったのですが、十数年使って汚かったので捨ててしまいました。 昨日までは3つ折りマットレスの上に敷きパッド、掛け布団がないので…

Ruby 1.9.2でMeCabを使う

MeCabで形態素解析 ツイートなんかを分析したいのなら、まずは形態素解析しなきゃオハナシにならないでしょ、と。たとえば「僕は杉山です。」って文を形態素っていう単位に分けて、その形態素の情報を得る、と。形態素の情報っていうのは読み方だとか品詞だ…

ツイート収集その後(運用へ)

Twitter Streaming APIでのストリーミング切断 ツイート収集スクリプトが止まってしまう件は、tweetstreamの中でリコネクトできないというようなエラー表示でした。その後も同様に停止したのですが、3時に開始したものが5:39に停止していたので、長時間接続…

日本で2番目に大きなタイ焼き

全然関係ないのですが、近所になでしこジャパンの丸山桂里奈さんが住んでいます。先日、桂里奈さんのブログで日本で2番目に大きな鯛焼きというものが紹介されていました。 近所のお店だったので、私も購入してきました。そのお店での一番大きなサイズの鯛焼…

Twitter Streaming APIを試す

TwitterのStreaming API TwitterのStreaming APIを使ってみたくなりました。 Streaming APIというのは、まあその名前通りなのですが、ツイートがストリーミングされてくるAPIです。 大規模データで遊んでみたい 私は前職で音声認識用の統計的言語モデル(こ…