読者です 読者をやめる 読者になる 読者になる

gocha124の日記

ごちゃごちゃ書きます

集合知(その2)

学習アルゴリズム

 

学習の種類 アルゴリズム
予測モデル 決定木
ニューラルネットワーク
回帰
ベイジアンビリーフネットワーク
データ分析やパターン抽出の自動化 k-meansクラスタリング
階層的クラスタリング
密度ベースのクラスタリング

予測モデルの種類。

予測される属性 予測モデル 問題
カテゴリ値 分類器(classification) 分類問題
連続値 リグレッサー(regresor) 回帰問題

集合知

集合知の本を読んでいてメモ。

 

集合知の収集

ユーザーとアイテム。

アイテムは記事、写真、動画など。

アイテムはメタデータを持つ。

メタデータはキーワード、タグ、評価、属性など。

メタデータの情報源は、属性ベース、コンテンツベース、ユーザアクションベース。

 

コンテンツベース分析と協調フィルタリング

 

テキストのメタデータ表現であるTerm、Term Vector

ベクトル空間モデル。ターム頻度(TF)、逆出現頻度(IDF)。

 

類似度。

コサインベースの類似度計算は、ベクトルの内積

相関ベースの類似度計算は、ピアソンの相関係数r。-1〜1。

調整コサインベースの類似度計算。

 

タグづけ。

スタッフによるもの
ユーザによるもの
自動生成によるもの

 

タグづけの指針。

  • 可能であればタグ辞書を構築する。
  • スタッフによるタグのみを扱うシステムでは、タグの重み付けはそのアイテムにつけられたタグの個数と、タグのIDFによって決まる。
  • 3種のタグ生成源を混在させて用いることができる。
  • タグづけのときに類義語辞書を作成すること。

ユーザによるタグづけから知識を抽出する例。

  • 関連するアイテムはどれとどれ?
  • あるユーザが関心を持つであろうアイテムはどれ?
  • 新しいアイテムがあらわれたときに、それに関心を持つユーザは誰?

類似したタグを探す。

 

SBクリエイティブ:【ダウンロード】『集合知イン・アクション』

  

コンテンツの分類。

記事
商品
分類語
ブログ
Wiki
グループ機能、掲示板
写真と動画
投票
検索キーワード
プロファイルページ
ツールと帳票
チャットログ
レビュー
3行広告
リスト

 

 知識を抽出する。

トークン化 ターム取り出し。
正規化 タームやフレーズを小文字にする。
ストップワードの除去 頻出するタームを除去。
ステミング 複数形に対処するために、タームを語幹に変換する。

 

集合知の導出

属性の分類。

連続(数量) 実数をとる 連続 サイトを見ていた時間
順序 属性値と属性値のあいだには順序が存在する 離散または連続 長、中、短
名義 属性ちと属性値のあいだには順序が存在しない 離散 男、女

 

推薦

おすすめ

ブックマークから

(未検索時に表示)

 

あなたの好みに似ている人

ブックマークから

 

✖️✖️を見た人はこれも見ています

閲覧ログから

 

他人のブックマークが見れるとよい

 

入門ソーシャルデータ

Graphvis

Protovis

https://github.com/ptwobrussell/Mining-the-Social-Web

 

集合知インアクション

集合知プログラミング

 

うちの子のしつけ

うちの子どもに躾できていない。対策を検討。

 

状況

一般的なこととして、

  • 子ども自身で時間管理することは難しい。
  • 子ども自身の話をきちんと聞いてあげるのが大事。
  • 叱ると怒るは別もの。
  • 暴力でなく、しつけとして手を出すこともある。
  • 男の子は口べた、女の子は口が達者。

 

うちの特徴として、

  • 色々と口うるさい。
  • テレビ以外に子ども一人で楽しめることがない(?)
  • 年の離れた下の子がいる。
  • 上の子にとって遊び相手でなく面倒見る相手。何かあると自分ばかり怒られる。
  • 親が決めた1週間毎日守れと言っているルールを完全に守れないと、3DSできない(まれにやらせてもらえているみたい)

 

うちの子の特徴として、

  • ごめんなさいを言わない。
  • 自分が悪いと思っていないか、自分より他の人のほうが悪いから自分は悪くないと思っている。
  • 四六時中ソファーでゴロゴロ。
  • 「デザートは?」がしつこい。
  • 無いと「ハぁ!?なんでぇ!?」と言う(言われる側はムカつく)。
  • 「DVD見ていい?」がしつこい。
  • おとうとが「テレビ見たくない」と言うと、「xxxしてあげるからさぁ」とか言って見させるのに、言ったことを実行しない。
  • 本人に間違いがないのに「ハぁ!?知らんし!?」と言う。
  • はたから見て本人が悪いのに「オレちげーし」「オレじゃねーし」「オレ悪くないし」。
  • 叱られて、捨てる・出て行け・出て行く・自分でやれとオドされても「すればぁ!?」「べつにいいし」

つまり、

  1. ほとんどのことは、自分は悪くない、他人が悪い
  2. グゥたら
  3. 言われたことをやらない、自分で言ったこともやらない
  4. クチが悪すぎる

 

検討

検討中。

 

 

 

形態素解析のエンジン

janome

https://pycon.jp/2015/ja/schedule/presentation/68/

Mecab

マリモ

Rosette

Chasen

Kuromoji

コンビナトリアルテクノロジー

コンビナトリアルテクノロジーを読みました。少し。

 

入門 機械学習

オライリーの入門 機械学習を読みました。

 

正則化

Lambda,ハイパーパラメータ。