2011-04-01から1ヶ月間の記事一覧

RSSフィードから単一品詞の単語別出現数を取得してみた.

今回はOreilly集合知プログラミングの第3章を参考に指定した日本語のRSSフィードを形態素解析して,単一品詞の単語別出現数を取得するPythonコードを作成してみました.集合知プログラミング作者: Toby Segaran,當山仁健,鴨澤眞夫出版社/メーカー: オライリ…

形態素解析エンジンMeCab-pythonを使ってみた.

これから自然言語処理をかじっていこうと思うので,今回は日本語を単語ごとに分解してくれる「形態素解析エンジン」をPythonで使ってみました.フリーで使える形態素解析エンジンとしては,Yahoo!JapanのAPIとMeCab(めかぶ)というものが一般的らしく,今回…

東電消費電力データのベイズ曲線回帰

今回は東電の消費電力データにベイズ曲線回帰を適用してみました.学習データは東電が公開しているcsvデータで,入力は時刻 [時],出力は消費電力 [万kW]です. (ほんとは気温とか,平日or休日かのダミー変数も入力しないと消費電力予測には使えないけど.…

ブログ再開&Pythonでのcsvの入出力

半年くらい放置してたんですけど,ソースコードの備忘録をつけたいので再開します!当面はPython+機械学習(あと,できればMATLAB/Simulinkでの制御シミュレータ)をネタとして書いていきます. - 今回は,データ形式としてメジャーなcsv形式のファイルのPyth…