ヌッ

適当

yahooの形態素解析試した話とIT界隈の情報の話

初めてお母さんAPI以外のAPIを叩きました.

 

前回のブログ 

文章中から頻出単語の抽出 - コンテンツ置き場

 

これを投稿したら黒サボテン氏(@kurosabo)から「Yahooの形態素解析ではいかんのか?」とのお達しが来たので試しにやってみました.

 

サンプルコード参考にしたら割りとすぐ出来た.

意味のある単語の取得が出来るのはもちろん,

品詞を指定出来るし,頻度の高い順にソートされてるのでコードも短くすんで良い.

が,解析結果返ってくるのに5秒くらいかかる .

文字にすると大したことないけど実際にやってみると結構かかってるように思える.

そのあたりどうにかならないかと上司に聞いたところ,

phpのsimplexml_load_file関数は異様に遅くて,

HTTP/Clientとsimplexml_load_string関数を使うと良いとのことだった.

 これは他のAPIにも言えることみたい.

実際にやって計測してみたらなんと0.1秒!

これなら実際に使ってもあんまりイライラしない.

今後は別のAPIにも頼ろう.

ありがとうy社.

 

しかしここ最近先生や上司に「これこれこういうのがありますよ」みたいな話をすると,

「すごいなぁよく知ってるなぁ」みたいに褒められるんだけど,

大体そういうのって俺が高専のときの友人達から聞いた話なんだよな.

もちろん褒められて悪い気はしないけど若干自分がセコいことしてる感じがするというか.

一番良いのは自分で色々記事を見て知見を深めることなんだろうけども,

周りの友人達は一体どういう風に情報収集をしてるのだろうか.

 とはいえ新しいサービスの情報もそうだけど,

すでに本とか出てるようなツールの知識も全然足りてない.

暇だ〜とか言ってダラダラしてないで,せめてもう少しでも本を読まないといかんな,

と思いました.

 

以上です.