Syllabus data

開講年度
2026Year
開講学期
First Semester
科目名
Web Mining
授業種別
Lecture
科目名(英語)
Web Mining
授業情報(授業コード・クラス・授業形態)
A2300018 Web Mining
担当教員
KITAYAMA Daisuke
単位数
2.0Credits
曜日時限
Tue.2Period
キャンパス
Shinjuku Campus
教室
A-0712教室
学年
3Year

学位授与の方針
1 基礎知識の修得   0 %
2 専門分野の知識・専門技術の修得   50 %
3 汎用的問題解決力の修得   40 %
4 道徳的態度と社会性の修得   10 %
具体的な到達目標
Webメディアやソーシャルメディアについての理解を深める.データマイニングの基礎的な手法を習得する.データマイニング手法をWeb・ソーシャルメディアに適応する手法について理解を深める.
受講にあたっての前提条件
到達目標をよく理解し、高いレベルでの達成を目指す意欲があること
授業の方法とねらい
ビッグデータに代表されるように,大規模データの収集・蓄積が容易になった現在,収集した情報を無駄にせず,いかに活用するかが様々な分野において重要な課題となっている.Webは巨大なテキストデータの宝庫であり,Webデータ,テキストデータに潜むデータの傾向をつかむことが重要となってきている.この授業では,自然言語処理ならびにテキストマイニングについて,その考え方及び代表的な手法について理解し,Webのような大規模テキストに対して応用する手法を習得する.
講義において自然言語処理・テキストマイニングの理論を学び,講義中に出す課題によって自然言語処理・テキストマイニング手法の習熟を目指す.
この講義では部分的に反転授業を取り入れ,事前に講義資料,および該当範囲の教科書を読んでいることを前提に,講義中に板書による解説及び課題に取り組む.
理論に関しては講義資料,設計・操作に関しては講義中に示すWebページを参考に復習し,理解を進めること.
AL・ICT活用
Flip Teaching/Presentation

第1回
授業形態
授業情報欄記載の通り
事前学習
事前公開している講義資料に目を通し,気になった箇所をメモしておく.
2時間
授業内容
第1回:Webマイニングと社会
 代表的なWebマイニングの応用やWebデータの紹介を行い,講義の全容を理解する.
事後学習・事前学習
講義中に出題する課題に関して,疑問点等を報告する.
「WebマイニングとAI」について講義中に示される観点に基づいて各自調べ,知識を整理しておく.
4時間
第2回
授業形態
授業情報欄記載の通り
授業内容
第2回:WebマイニングとAI
 AIの歴史や概念,Webマイニングとの関係について学ぶ.
事後学習・事前学習
講義中に出題する課題に関して,疑問点等を報告する.
「テキストの基本処理:形態素解析と文書ベクトル」について講義中に示される観点に基づいて各自調べ,知識を整理しておく.
4時間
第3回
授業形態
授業情報欄記載の通り
授業内容
第3回:テキストの基本処理:形態素解析と文書ベクトル
 形態素解析やBag-of-words,TF-IDF法などの文書ベクトル表現について学ぶ.
事後学習・事前学習
講義中に出題する課題に関して,疑問点等を報告する.
「テキストの基本処理:単語・文書の分散表現」について講義中に示される観点に基づいて各自調べ,知識を整理しておく.
4時間
第4回
授業形態
授業情報欄記載の通り
授業内容
第4回:テキストの基本処理:単語・文書の分散表現
 現在のテキスト処理の基本となる単語や文書の分散表現を学習する.
事後学習・事前学習
講義中に出題する課題に関して,疑問点等を報告する.
「分類・回帰問題:評価極性分析」について講義中に示される観点に基づいて各自調べ,知識を整理しておく.
4時間
第5回
授業形態
授業情報欄記載の通り
授業内容
第5回:分類・回帰問題:評価極性分析
 分類問題としての評価極性分析のアルゴリズムについて学ぶ.
事後学習・事前学習
講義中に出題する課題に関して,疑問点等を報告する.
「分類・回帰問題:文書分類」について講義中に示される観点に基づいて各自調べ,知識を整理しておく.
4時間
第6回
授業形態
授業情報欄記載の通り
授業内容
第6回:分類・回帰問題:文書分類
 分類問題としての文書分類とそのアルゴリズムについて学ぶ.
事後学習・事前学習
講義中に出題する課題に関して,疑問点等を報告する.
「分類・回帰問題:文書の品質推定」について講義中に示される観点に基づいて各自調べ,知識を整理しておく.
4時間
第7回
授業形態
授業情報欄記載の通り
授業内容
第7回:分類・回帰問題:文書の品質推定
 回帰問題としての文書の品質推定とそのアルゴリズムについて学ぶ.
事後学習・事前学習
講義中に出題する課題に関して,疑問点等を報告する.
「系列ラベリング:固有表現認識」について講義中に示される観点に基づいて各自調べ,知識を整理しておく.
4時間
第8回
授業形態
授業情報欄記載の通り
授業内容
第8回:系列ラベリング:固有表現認識
 系列ラベリング問題としての固有表現認識およびそのアルゴリズムについて学ぶ.
事後学習・事前学習
講義中に出題する課題に関して,疑問点等を報告する.
「系列ラベリング:誤り検出」について講義中に示される観点に基づいて各自調べ,知識を整理しておく.
4時間
第9回
授業形態
授業情報欄記載の通り
授業内容
第9回:系列ラベリング:誤り検出
 系列ラベリング問題としての誤り検出とそのアルゴリズムを理解する.
事後学習・事前学習
講義中に出題する課題に関して,疑問点等を報告する.
「Webマイニング:構造マイニング」について講義中に示される観点に基づいて各自調べ,知識を整理しておく.
4時間
第10回
授業形態
授業情報欄記載の通り
授業内容
第10回:Webマイニング:構造マイニング
 Webの構造マイニングとそのアルゴリズムについて学ぶ.
事後学習・事前学習
講義中に出題する課題に関して,疑問点等を報告する.
「Webマイニング:文書要約」について講義中に示される観点に基づいて各自調べ,知識を整理しておく.
4時間
第11回
授業形態
授業情報欄記載の通り
授業内容
第11回:Webマイニング:文書要約
 文書要約とそのアルゴリズムについて学ぶ.
事後学習・事前学習
講義中に出題する課題に関して,疑問点等を報告する.
「Webマイニング:対話システム」について講義中に示される観点に基づいて各自調べ,知識を整理しておく.
4時間
第12回
授業形態
授業情報欄記載の通り
授業内容
第12回:Webマイニング:対話システム
 対話システムとそのアルゴリズムについて学ぶ.
事後学習・事前学習
講義中に出題する課題に関して,疑問点等を報告する.
「Webと言語資源」について講義中に示される観点に基づいて各自調べ,知識を整理しておく.
4時間
第13回
授業形態
授業情報欄記載の通り
授業内容
第13回:Webと言語資源
 Web上にある言語資源と言語資源の収集,作成方法について学ぶ.
事後学習・事前学習
講義中に出題する課題に関して,疑問点等を報告する.
「Webマイニングの応用例」について講義中に示される観点に基づいて各自調べ,知識を整理しておく.
4時間
第14回
授業形態
授業情報欄記載の通り
授業内容
第14回:Webマイニングの応用例
 実際の応用システムを紹介し,その可能性について議論する.
事後学習・事前学習
講義中に出題する課題に関して,疑問点等を報告する.
最終課題について取り組み,レポートを仕上げる.
4時間
第15回
授業形態
遠隔(オンデマンド)
授業内容
第15回:学習内容の振り返り
事後学習
自身が仕上げた最終課題レポートについて,読み直し講義を振り返る.
2時間

成績評価の方法
毎回の講義中に課題の提出を求める.成績は課題および最終レポートの成績で判定する.
講義中に示す課題,最終レポートの評価割合は2:8とし,A+~Fの6段階評価でD以上のものを合格とする.
受講生へのフィードバック方法
オンデマンド授業となる「第15回」に,KU-LMSに全体の講評をアップロードします.

教科書
指定なし
参考書
自然言語処理の教科書,小町守,技術評論社

オフィスアワー
曜日:火曜日
時間:15:50〜17:20
居室:A2472(新宿キャンパス)
受講生へのメッセージ
データは蓄積しているだけでは,なんの役にも立ちません.現在,Web上には沢山のデータがひしめいていますが,これらは活用してこそです.その活用方法の1つであるWeb/テキストマイニングの手法を勉強して,世の中のデータの見方を変えていってください.

実務家担当科目
Not applicable
実務経験の内容

教職課程認定該当学科
Department of Information Systems and Applied Mathematics/Department of Informatic Sciences
その他の資格・認定プログラムとの関連
関連する科目である
教育課程コード
Ⅲ3b
教育課程コードの見方【例】 Ⅰ2a(Ⅰ…Ⅰ群、2…2年配当、a…必修) ※ a : 必修 b : 選択必修 c : 選択 ※複数コードが表示されている場合には入学年度・所属学科の学生便覧を参照のこと