Syllabus data

開講年度
2025Year
開講学期
Second Semester
科目名
Web Mining Exercise
授業種別
Practice
科目名(英語)
Web Mining Exercise
授業情報(授業コード・クラス・授業形態)
A2300019 Web Mining Exercise
担当教員
KITAYAMA Daisuke
単位数
1.0Credits
曜日時限
Fri.5Period
キャンパス
Shinjuku Campus
教室
A-1055 Izumi17

学位授与の方針
1 基礎知識の修得   0 %
2 専門分野の知識・専門技術の修得   50 %
3 汎用的問題解決力の修得   40 %
4 道徳的態度と社会性の修得   10 %
具体的な到達目標
実際のWebメディアやソーシャルメディアのデータを用いて,データマイニング・Webマイニングを行える.そのアルゴリズムおよび結果の評価について理解を深める.ネットワーク接続によるデータの取得,管理方法を学ぶ.
受講にあたっての前提条件
システム数理学科3年前期科目である「Webマイニング」を受講していることが望ましい.また,その講義内容を十分に理解していること.
授業の方法とねらい
3年前期に開講されるWebマイニングの講義を基に,実データについて演習することでそのアルゴリズムおよび評価方法について学び,Web上のデータ取得に必要となるネットワークアクセス技術を学ぶ.
演習課題に関しては,次の講義で解説を行い,復習を兼ねる.
毎回の講義に際し,事前学習として次回の課題に取り組んでおき,何がわかり何がわからないかを整理しておくこと.
以下に標準的な授業計画を記載するが,受講者の興味や進度に応じて順番の入れ替えやボリュームの調整を行う.
AL・ICT活用
Group Work/Presentation

第1回
授業形態
授業情報欄記載の通り
事前学習
基本的なpythonの書き方,HTML,CSSの書き方を予習しておく.
1時間
授業内容
第1回:Web・ソーシャルメディアデータとPython基礎(1)
 演習の全容を把握し,演習で用いるデータの内容と構造を理解する.
 Pythonの基本的文法のうち文字列を用いた演習を行う.
事後学習・事前学習
講義中に出題する課題の残りを解く.
また,次回に行う課題の予習をする.
2時間
第2回
授業形態
授業情報欄記載の通り
授業内容
第2回:Python基礎(2)
 Pythonの基本的文法のうち条件分岐,繰り返しを用いた演習を行う.
事後学習・事前学習
講義中に出題する課題の残りを解く.
また,次回に行う課題の予習をする.
2時間
第3回
授業形態
授業情報欄記載の通り
授業内容
第3回:Python基礎(3)
 Pythonの基本的文法のうちリスト,辞書を用いた演習を行う.
事後学習・事前学習
講義中に出題する課題の残りを解く.
また,次回に行う課題の予習をする.
2時間
第4回
授業形態
授業情報欄記載の通り
授業内容
第4回:データベースの構築
 データベースを設計,構築し,取得したデータをデータベースに登録する.
事後学習・事前学習
講義中に出題する課題の残りを解く.
また,次回に行う課題の予習をする.
2時間
第5回
授業形態
授業情報欄記載の通り
授業内容
第5回:データ処理演習
 データベース中のデータに対する統計的処理方法を学ぶ.
事後学習・事前学習
講義中に出題する課題の残りを解く.
また,次回に行う課題の予習をする.
2時間
第6回
授業形態
授業情報欄記載の通り
授業内容
第6回:テキストデータの分散表現
 テキストデータを各種アルゴリズムで扱いやすくするために分散表現で表す方法を演習する.
事後学習・事前学習
講義中に出題する課題の残りを解く.
また,次回に行う課題の予習をする.
2時間
第7回
授業形態
授業情報欄記載の通り
授業内容
第7回:非階層的クラスタリング演習
 k-means法などのアルゴリズムでデータクラスタリングを行う.
事後学習・事前学習
講義中に出題する課題の残りを解く.
また,次回に行う課題の予習をする.
2時間
第8回
授業形態
授業情報欄記載の通り
授業内容
第8回:階層的クラスタリング演習
 階層的凝集クラスタリングなどのアルゴリズムでデータクラスタリングを行う.
事後学習・事前学習
講義中に出題する課題の残りを解く.
また,次回に行う課題の予習をする.
2時間
第9回
授業形態
授業情報欄記載の通り
授業内容
第9回:分類アルゴリズム演習
 データの分類アルゴリズムを実装する.
事後学習・事前学習
講義中に出題する課題の残りを解く.
また,次回に行う課題の予習をする.
2時間
第10回
授業形態
授業情報欄記載の通り
授業内容
第10回:予測アルゴリズム演習
 回帰モデルなどの予測モデルを実装する.
事後学習・事前学習
講義中に出題する課題の残りを解く.
また,次回に行う課題の予習をする.
2時間
第11回
授業形態
授業情報欄記載の通り
授業内容
第11回:WebアクセスとHTML,CSS
 Webアクセスのために必要となる情報通信の基礎知識を理解する.
事後学習・事前学習
講義中に出題する課題の残りを解く.
また,次回に行う課題の予習をする.
2時間
第12回
授業形態
授業情報欄記載の通り
授業内容
第12回:Webアクセス演習とWebの構造マイニング演習
 実際にWebデータへアクセスし,情報通信の基礎知識に関しての演習を行う
 PageRankやHITSなどのWebのネットワーク構造に対するマイニング手法を実装する.
事後学習・事前学習
講義中に出題する課題の残りを解く.
また,次回に行う課題の予習をする.
2時間
第13回
授業形態
授業情報欄記載の通り
授業内容
第13回:Web・ソーシャルメディアデータの取得とWebの内容マイニング演習
 WebAPIへアクセスし,データを取得するプログラムの構築を行う.
 Web情報検索,インデクスといった内容に対する情報抽出手法を実装する.
事後学習・事前学習
講義中に出題する課題の残りを解く.
2時間
第14回
授業形態
授業情報欄記載の通り
授業内容
第14回:Webマイニングの応用システム
Webマイニングの応用システムについて実装し,動作を考察する
事後学習・事前学習
最終課題に取り組む.
1時間
第15回
授業形態
授業情報欄記載の通り
授業内容
第15回:学習内容の振り返り
事後学習
自身の作成したレポートおよび,これまでの演習課題を見直し,講義を振り返る.
1時間

成績評価の方法
成績は最後に課すレポート課題の成績のみで判定する.
A+~Fの6段階評価でD以上のものを合格とする.
受講生へのフィードバック方法
オンデマンド授業となる「第15回」に,KU-LMSに全体の講評をアップロードします.

教科書
指定教科書なし
参考書
ソーシャル・ビッグデータサイエンス入門—基本概念からマイニング技術、応用まで,石川 博,コロナ社
Pythonによるスクレイピング&機械学習,クジラ飛行机,ソシム株式会社

オフィスアワー
曜日:水曜日
時間:15:50〜17:20
居室:A2472(新宿キャンパス)
受講生へのメッセージ

実務家担当科目
Not applicable
実務経験の内容

教職課程認定該当学科
Department of Information Systems and Applied Mathematics/Department of Informatic Sciences
その他の資格・認定プログラムとの関連
関連する科目である
教育課程コード
Ⅲ3c
教育課程コードの見方【例】 Ⅰ2a(Ⅰ…Ⅰ群、2…2年配当、a…必修) ※ a : 必修 b : 選択必修 c : 選択 ※複数コードが表示されている場合には入学年度・所属学科の学生便覧を参照のこと