読者です 読者をやめる 読者になる 読者になる

ヌッ

適当

python2.7から3.5へのアップグレード(NLP風味)

研究で使っているコードを2.7から3.5へアップグレードした。 理由はpython3がいいらしいという話を前にカンファで聞いたからというだけ。具体的に何がいいかはよく覚えてないけどレガシーなものを使い続けるのは良くないと思うし、自分でもやるべきだと思っ…

卒論書くためにやった環境設定

テスト勉強前は掃除したくなる、というのはあるあるだと思う。それと同様の心理なのかわからないけれど卒論を書く前に環境を色々弄るのに結構時間かけてしまった。ということで設定したことについて記録を残しておこうと思う。 TeX ラボメンは断然Word派が多…

TeX講習会をした話

研究室にてTeXの講習会をしました。一応講師です。友達に勉強教えるとか前に出て発表とかはあったけど講師的なことするのは初めてですね。本当は先々週に一回目の講習をやったのですがゲスト用のWiMAX君ではインストールがままならず、TeXの話をチョロっとし…

チーム開発実践入門を読みました

インターン先では開発フローについてミーティングをやったりするのですが、 結局どのツールがいいのかなぁとかいつから実施しようかとかでなかなか決まらないという状態が続いてます。 大体調査してくるときはググってツール比較して資料にまとめたりするけ…

python gensimを使い始めました

研究でpython gensim使おうとボスからの指示があったのでいれました python gensimはテキストからのトピック抽出ライブラリ 具体的にはブログの記事とかを見て、これは「音楽」に関するものだなとか「映画」に関するものだなってのが分かるという処理を簡単…

スクレイピングとかいう技術

先日ありたそ、先輩後輩と飲んでた時、ありたそが最近作った行きつけのメイド喫茶のメイドのTwitter情報をぶっこ抜くプログラムの話になった。 ぶっちゃけそれを聞いてる他の人々はドン引きで声が出なかったが、 話してる本人は非常に活き活きとしていた。 …

最近のインターンでのデータベースとスケジュールの話

色々ありましたが大丈夫そうなのでインターン続けてます。 以前友人と飲んでるとき あ◯たそ「MySQL使っててもクエリ文を直接送るってことはないでしょ?」 ぼく「え、それが普通なんじゃないの……?」 みたいなことがありました。 でも使ってるツール全然違う…

yahooの形態素解析試した話とIT界隈の情報の話

初めてお母さんAPI以外のAPIを叩きました. 前回のブログ 文章中から頻出単語の抽出 - コンテンツ置き場 文章中から頻出単語の抽出 - コンテンツ置き場 これを投稿したら黒サボテン氏(@kurosabo)から「Yahooの形態素解析ではいかんのか?」とのお達しが来た…

文章中から頻出単語の抽出

たぶん自然言語処理に初めて手を出しました. HTMLの記事から頻出単語を抽出して,その頻出単語でキーワード検索して 別の記事をオススメするってのが目的. こういう文章中の単語の抽出には大きく分けて二種類あるとのこと. まず辞書を使う形態素解析とい…

Smartyのdisplay()でテンプレート表示されない問題

MVCモデルで設計したPHPの話です. Viewにあたる部分をSmartyを使っていたのですが 真っ白い画面しか出てこない!と嘆いて数日間戦ってました. 結局今日あっさり解決したのでハマりそうなポイントをまとめときます. パーミッションのミス 多分一番多いであ…

MySQLの文字コードでハマった話

初めての技術的な記事ですがかなり初歩的な話です. 現在練習でWebサイトを作っています. とりあえずデータベースになんか入力すると サイトに反映されるだけのところから作ってたのですが, 日本語を入力してもサイト上では「???」と表示されるという問題…