Googleの強みは ささえるのは世界一のインフラ. Google File System 2008年度後期 情報システム構成論2 第10回 クラウドと協調フィルタリング. 初期(1999年)の Googleクラスタ. 最近のデータセンタ Google Chrome Comicより

Similar documents
Cloud Connector 徹底解説. 多様な基盤への展開を可能にするための Citrix Cloud のキーコンポーネント A-5 セールスエンジニアリング本部パートナー SE 部リードシステムズエンジニア. 哲司 (Satoshi Komiyama) Citrix

携帯電話の 吸収率 (SAR) について / Specific Absorption Rate (SAR) of Mobile Phones

携帯電話の 吸収率 (SAR) について / Specific Absorption Rate (SAR) of Mobile Phones

Introduction to Information and Communication Technology (a)

今日の予定 1. 展開図の基礎的な知識 1. 正多面体の共通の展開図. 2. 複数の箱が折れる共通の展開図 :2 時間目 3. Rep-Cube: 最新の話題 4. 正多面体に近い立体と正 4 面体の共通の展開図 5. ペタル型の紙で折るピラミッド型 :2 時間目 ~3 時間目

Androidプログラミング 2 回目 迫紀徳

J の Lab システムの舞台裏 - パワーポイントはいらない -

Yamaha Steinberg USB Driver V for Mac Release Notes

MySQL Cluster 7.3 リリース記念!! 5 分で作る MySQL Cluster 環境

Unofficial Redmine Cooking - QA #782 yaml_db を使った DB のマイグレーションで失敗する

Certificate of Accreditation

Relaxed Consistency models and software distributed memory. Computer Architecture Textbook pp.79-83

PSLT Adobe Typekit Service (2016v1.1)

WD/CD/DIS/FDIS stage

UB-U01III/U02III/U03II User s Manual

A. 展開図とそこから折れる凸立体の研究 1. 複数の箱が折れる共通の展開図 2 通りの箱が折れる共通の展開図 3 通りの箱が折れる共通の展開図そして. 残された未解決問題たち 2. 正多面体の共通の展開図 3. 正多面体に近い立体と正 4 面体の共通の展開図 ( 予備 )

Synchronization with shared memory. AMANO, Hideharu Textbook pp.60-68

Zabbix ログ解析方法. 2018/2/14 サイバートラスト株式会社 Linux/OSS 事業部技術統括部花島タケシ. Copyright Cybertrust Japan Co., Ltd. All rights reserved.

Studies of Large-Scale Data Visualization: EXTRAWING and Visual Data Mining

Lecture 4 Branch & cut algorithm

サーブレットと Android との連携. Generated by Foxit PDF Creator Foxit Software For evaluation only.

Saki is a Japanese high school student who/ has just started to study/ in the US.//

2. 集団の注目位置推定 提案手法では 複数の人物が同一の対象を注視している状況 置 を推定する手法を検討する この状況下では 図 1 のよう. 顔画像からそれぞれの注目位置を推定する ただし f は 1 枚 この仮説に基づいて 複数の人物を同時に撮影した低解像度顔

楽天株式会社楽天技術研究所 Autumn The Seasar Foundation and the others all rights reserved.

Computer Programming I (Advanced)

Online Meetings with Zoom

JASCO-HPLC Operating Manual. (Analytical HPLC)

Centralized (Indirect) switching networks. Computer Architecture AMANO, Hideharu

PRODUCT DESCRIPTIONS AND METRICS

Rechargeable LED Work Light

Agilent. IO Libraries Suite 16.3/16.2 簡易取扱説明書. [ IO Libraries Suite 最新版 ]

フラクタル 1 ( ジュリア集合 ) 解説 : ジュリア集合 ( 自己平方フラクタル ) 入力パラメータの例 ( 小さな数値の変化で模様が大きく変化します. Ar や Ai の数値を少しずつ変化させて描画する. ) プログラムコード. 2010, AGU, M.

Yamaha Steinberg USB Driver V for Windows Release Notes

Kazunari Okada( 岡田一成 ) Sr. Technical Marketing Manager ISO Vibration Analyst (CAT II) National Instruments Corporation Japan

Unified System Management Technology for Data Centres

MathWorks Products and Prices Japan September 2016

Certificate of Accreditation

~ ソフトウエア認証への取り組みと課題 ~

Quick Install Guide. Adaptec SCSI RAID 2120S Controller

マルチビットアップセット耐性及びシングルビットアップセット耐性を備えた

DürrConnect the clever connection. The quick connection with the Click

振込依頼書記入要領 Entry Guide for Direct Deposit Request Form

暗い Lena トーンマッピング とは? 明るい Lena. 元の Lena. tone mapped. image. original. image. tone mapped. tone mapped image. image. original image. original.

PCIe SSD PACC EP P3700 Intel Solid-State Drive Data Center Tool

Vehicle Calibration Techniques Established and Substantiated for Motorcycles

Industrial Solar Power PoE Switch

Preparing Information Design-Oriented. Posters. easy to. easy to. See! Understand! easy to. Convey!

本書について... 7 本文中の表記について... 7 マークについて... 7 MTCE をインストールする前に... 7 ご注意... 7 推奨 PC 仕様... 8 MTCE をインストールする... 9 MTCE をアンインストールする... 11

Project to Transfer Mission-critical System of Banks to Private Cloud

UML. A Model Trasformation Environment for Embedded Control Software Design with Simulink Models and UML Models

Yamaha Steinberg USB Driver V for Windows Release Notes

tp.responsewriter, r *http.request) { /* Hmmm, I wonder if this main */ hosttokens := strings.split(r.host, ":"); if len(hosttok

サンプル. NI TestStand TM I: Introduction Course Manual

IRS16: 4 byte ASN. Version: 1.0 Date: April 22, 2008 Cisco Systems 2008 Cisco, Inc. All rights reserved. Cisco Systems Japan

Methods to Detect Malicious MS Document File using File Structure Inspection

Web Billing User Guide

JCCT U.S.-China Cloud Computing Seminar

PGroonga 2. Make PostgreSQL rich full text search system backend!

BMW Head Up Display (HUD) Teardown BMW ヘッドアップディスプレイティアダウン

Chapter 1 Videos Lesson 61 Thrillers are scary ~Reading~

Infrared Data Association Trademark and Brand Guidelines

Verify99. Axis Systems

Ubuntuを利用した世界最高のOSSプラットフォーム. Takaaki Suzuki Canonical - Solutions Architect

Snoop cache. AMANO, Hideharu, Keio University Textbook pp.40-60

Video Annotation and Retrieval Using Vague Shot Intervals

PNRGOV/Ver11.1/ 旅客氏名表予約情報報告 (PNR01)

Private Sub 終了 XToolStripMenuItem_Click(ByVal sender As System.Object, ByVal e As System.EventArgs) Handles 終了 XToolStripMenuItem.

URL IO オブジェクト指向プログラミング特論 2018 年度只木進一 : 工学系研究科

第 2 回先進スーパーコンピューティング環境研究会 (ASE 研究会 ) 発表資料

IPv6 関連 WG の状況 (6man, v6ops, softwire)

船舶保安システムのセルフチェックリスト. Record No. Name of Ship 船名 flag 国籍 Name of Company 会社名 Date 点検日 Place 場所 Checked by 担当者名. MS-SELF-CHK-SHIP-j (2012.

HPE Insight Control サーバープロビジョニング 7.6 ビルドプランリファレンスガイド

The Secret Life of Components

L3 SSG/SSD を使用している PPPoA クライアントで PC を設定すること

Interdomain Routing Security Workshop 21 BGP, 4 Bytes AS. Brocade Communications Systems, K.K.

さまざまなニーズにお応えできるラインナップ!


BABr11.5 for Linux のインストール 2007/12/21. You are running Linux on Kernel smp. Analyzing the environment

4. 今回のプログラム 4.2 解決のクラス SearchNumber.java

Appliance Edition 入門ガイド

NI TB Introduction. Conventions INSTALLATION INSTRUCTIONS Wire Terminal Block for the NI PXI-2529

Firefox for mac

autocad 2000i update 647D5CDB9807FA8605EC016DF2CFDE43 Autocad 2000i Update 1 / 6

API サーバの URL. <?xml version="1.0" encoding="utf-8"?> <!DOCTYPE COMPLIANCE_SCAN SYSTEM "

Introduction to the Himawari-8 Atmospheric Motion Vector Algorithm

Manufacturing that s good for people and good for the environment

DSK8AD1DA. 8ch A/D & 1ch D/A for DSK/EVM.

2017 年 12 月 14 日 インテル株式会社

(Lexus GS250 用 ) ティアダウン

present on a local docker container to Kong. This special event is open only to Cisco Customers and Partners. This project contains sample code to be

GEO Grid の概要とその IT 技術の現状 将来について

Wireless Adapter YW-2L

Modern editor-independent development environment for PHP

Invitrogen Custom Primer Ordering Guide

Emporio Armani Replica Handbags Fake Watches

Effects of Aging and Visual Acuity on the Legible Point Size for a Single Character on an E-paper Display 電子ペーパーディスプレイの単一文字の読み取れるポイントサイズに対する加齢と視力の影響

Oracle Cloud で実現する DevOps

JTC 1 における IoT 関連の標準化動向と 日本の取組み

INFRAGISTICS WPF 13.2 サービスリリースノート 2014 年 12 月

The Optical Characteristics of the Fore-Optics and the Calibration for. Direct-Sun UV Observation with Brewer Spectrophotometers

Transcription:

Googleの強みは 2008年度後期 情報システム構成論2 第10回 クラウドと協調フィルタリング 西尾 信彦 nishio@cs.ritsumei.ac.jp 立命館大学 情報理工学部 Cloud Computing 全地球規模で構成された圧倒的なPCクラスタ 部分的な機能不全を補う機能 あらゆる種類の情報へのサービスの提供 Web上の 全 情報 地図情報 (実世界情報) どのように利用されているかを機械学習 携帯電話への新展開 フリーソフトウェアで構成される開発基盤 Android ささえるのは世界一のインフラ 初期(1999年)の Googleクラスタ 膨大なPCクラスタにより構成 Googleは売っていないだけでPCの生産も自社用に行なっている 常にどこかのホストが壊れているても平気 クラウドコンピューティング 世界にコンピュータは5台だけ Google,Amazon,Yahoo,MS,IBM 世界中に分散するデータセンター 数十箇所 水力発電所のそばに設置 日本には法制上置けない 徹底した分散システム ファイルシステム Google File System データベースシステム Bigtable 分散処理システム MapReduce 最近のデータセンタ Google Chrome Comicより 1枚に4CPU 4枚の基板をコルク板 の上に集めて実装 しなう基板 HDDを空中実装 手作り 大量のケーブルと冷却 ファン Google File System Ubuntu LinuxのGoogle改良版をベース EXT3ファイルシステム テラバイトスケールのファイルの順次読み 書きに最適化 世界中のウェブデータを保存 数分で更新 Aggressiveなreplicationと分散アクセスによ る高速化 1

GFS: Master and Chunk servers Client Master Bigtable MySQL Relational DB( ) () ( ) URL etc Google MapReduce Map <, > Reduce Open source MapReduce Hadoop http://hadoop.apache.org/ Hadoop Distributed File System in place of GFS Let s look at an example: Reverse indexing for words We are not what we want to be, but at least we are not what we used to be. <we, 1> <are, 1> <not, 1> <what, 1> <we, 2> <to, 2> <be, 2> etc... Mapping Shuffling <we, 1> <we, 2> <we, 4> <we, 5> <are, 1> <are, 4> <not, 1> <not, 4> <what, 1> <what, 4> <to, 2> <to, 5> <be, 2> <be 5> <at, 3> <least, 3> <used, 5> 2

Reducing MapReduce Execution Overview <are, 1 4> <at, 3> <be, 2 5> <least, 3> <not, 1 4> <to, 2 5> <we, 1 2 4 5> <what, 1 4> <used, 5> MapReduce: Exectution Details Parallel Execution Machine Learning Technology Key Technology in Web 2.0: Recommendation: Collaborative Filtering Discovering groups: Clustering Support Vector Machine Bays Network And more Amazon: Recommendation Hello, Nobuhiko Nishio. We have recommendations for you. (Not Nobuhiko? ) Customers who bought this item also bought Most Helpful Customer Reviews 3

What Do Customers Ultimately Buy After Viewing This Item? 81% buy the item featured on this page:programming Collective Intelligence: Building Smart Web 2.0 Applications (36) $26.39 8% buyjavascript: The Good Parts (28) $19.79 4% buy Pragmatic Thinking and Learning: Refactor Your Wetware (Pragmatic Programmers) (9) $23.07 Example: Recommendation Collaborative Filtering is the basic technology for this. First introduced by David Goldberg at Xerox PARC in 1992. Let s see an example in Movie Reviewer s Web Site 4% buy Building Scalable Web Sites: Building, scaling, and optimizing the next generation of web applications (26) $26.39 Collected Preferences Who is similar to whom? Introduction of metric function Euclidean Distance Score Euclidean Distance Score in Python # Returns a distance-based similarity score for person1 and person2 def sim_distance(prefs,person1,person2): # Get the list of shared_items si={} for item in prefs[person1]: if item in prefs[person2]: si[item]=1 Who is similar to whom? Pearson Correlation Score Absorbs absolute evaluation difference. Corrects grade inflation # if they have no ratings in common, return 0 if len(si)==0: return 0 # Add up the squares of all the differences sum_of_squares=sum([pow(prefs[person1][item]-prefs[person2][item],2) for item in prefs[person1] if item in prefs[person2]]) return 1/(1+sum_of_squares) 4

# Returns the Pearson correlation coefficient for p1 and p2 def sim_pearson(prefs,p1,p2): # Get the list of mutually rated items si={} for item in prefs[p1]: if item in prefs[p2]: si[item]=1 # if they are no ratings in common, return 0 if len(si)==0: return 0 # Sum calculations n=len(si) # Sums of all the preferences sum1=sum([prefs[p1][it] for it in si]) sum2=sum([prefs[p2][it] for it in si]) # Sums of the squares sum1sq=sum([pow(prefs[p1][it],2) for it in si]) sum2sq=sum([pow(prefs[p2][it],2) for it in si]) # Sum of the products psum=sum([prefs[p1][it]*prefs[p2][it] for it in si]) # Calculate r (Pearson score) num=psum-(sum1*sum2/n) den=sqrt((sum1sq-pow(sum1,2)/n)*(sum2sq-pow(sum2,2)/n)) if den==0: return 0 r=num/den return r Personal Similarity Result Rose 0.99 Seymour 0.38 Puig 0.89 LaSalle 0.92 Matthews 0.66 Then? I (Toby) wants to have a movie recommendation not person. Creating recommendation for Toby The most similar person s favorite movies which I haven t seen? Too permissive! They might have not seen the good one that I might like. They might like the bad one that all other critics don t like. Movie Recommendation Result Let s aggregate the weighted remark summation for each movie! 5