SlideShare una empresa de Scribd logo
1 de 19
各種メタデータの特徴を考慮した
未知レシピへのメタデータ自動付与方式
背景(推薦精度の高精度化)
推薦精度の高精度化
レシピに適切なメタデータを付与
メタデータなしレシピ群 メタデータ付与済みレシピ群
子供が喜ぶレシピが
見つけにくい
子供が喜ぶレシピが
豊富!
ただし大量のレシピデータに適切なメタデータを
人手で付与することは容易ではない 1
本研究の狙い
メタデータ付与
済みデータ
未知レシピ
類似度分析に基づく未知レシピへの
メタデータ自動付与
メタデータ付レシピとの類似度分析に基づいたメタ
データ自動付与方式の開発を行う.
2
本研究で扱うメタデータ
先行研究(気分で料理を検索するシステム)にて扱っている
6軸のメタデータを採用する.
上記6軸のメタデータ付与済みレシピ500件
以下の6軸を -5 〜 5 で評価
からだ
こころ
味
時間
お金
アレンジ
[-5
[-5
[-5
[-5
[-5
[-5
⇔
⇔
⇔
⇔
⇔
⇔
5]
5]
5]
5]
5]
5]
(元気)(お疲れ)
(ワクワク)(シクシク)
(こってり)
(本格)
(豪華)
(アレンジ)
(あっさり)
(お手軽)
(安く)
(定番)
マスターレシピ
3
提案手法の開発手順
メタデータ付与
済みデータ
(マスターレシピ)未知レシピ
①マスターレシピ群の
特徴ベクトル抽出
②未知レシピ群の
特徴ベクトル抽出
③マスターレシピ群に対する未知レシピ群の
類似度分析に基づくメタデータ自動付与
4
メタデータ自動付与方法①
マスターレシピの最も類似度の上位のメタデータを
そのままコピーして,未知レシピに付与する(TOPコピー)
U(i) = M1(i)
U(i):未知レシピの各気分データ
M1(i):類似度ランク1位のレシピの気分データ
i:{からだ,ココロ,味,時間,お金,アレンジ}
未知レシピ
マスターレシピ
5
メタデータ自動付与方法②
マスターレシピの類似度の上位3件のメタデータを
平均してコピー(3件平均コピー)
U(i) =
Mn(i):対象未知レシピと類似度順
序がn番のマスターレシピの各気
分データ
3
M1(i) + M2(i) + M3(i)
未知レシピ
マスターレシピ
マスターレシピ
マスターレシピ
6
メタデータ自動付与方法③
マスターレシピの類似度の上位3件のメタデータに類似度順位を
考慮した重みを加えたものを平均してコピー(3件重み平均コピー)
U(i) =
S1 + S2 + S3
S1*M1(i) + S2*M2(i) + S3*M3(i) Sm:対象未知レシピと類似
度順位がm番のマスター
レシピとの類似度
未知レシピ
マスターレシピ
マスターレシピマスターレシピ
7
メタデータ自動付与方法④
マスターレシピの類似度の上位5件のメタデータを
平均してコピー(5件平均コピー)
U(i) =
5
M1(i) + M2(i) + M3(i) + M4(i) + M5(i)
未知レシピ
マスターレシピ
マスターレシピ
マスターレシピ
マスターレシピ
マスターレシピ
8
メタデータ自動付与方法⑤
マスターレシピの類似度上位5件のメタデータに,類似度順位を
考慮した重みを加えたものを平均してコピー(5件重み平均コピー)
U(i) =
S1 + S2 + S3 + S4 + S5
S1*M1(i) + S2*M2(i) + S3*M3(i) + S4*M4(i) + S5*M5(i)
未知レシピ
マスターレシピ
マスターレシピ
マスターレシピ
マスターレシピ マスターレシピ
9
評価実験のまとめ
10
これまでに行った5種類のメタデータ自動付与方式により
付与されたメタデータの妥当性は十分高いとはいえない.
からだ,こころ,味,時間,お金,アレンジの
各軸の特徴を,一つのベクトルで表すのは無理がある.
軸ごとの特徴量を個別に抽出!
軸ごとに特徴量を抽出
からだ
こころ
味
時間
お金
アレンジ
○○ハンバーグ
お弁当にぴったり・・・
パパッとできる・・・・
お疲れ
レシピ
元気
シクシク ウキウキ
お疲れ 元気
お手軽 本格
安く 豪華に
定番 アレンジ
軸の再検討
時間とからだの相関 0.55
時間とお金の相関 0.70
時間とアレンジの相関 0.35
味とからだの相関 0.76
味と時間の相関 0.68
味とお金の相関 0.65
味とアレンジの相関 0.25
お金とからだの相関 0.70
お金とアレンジの相関 0.38
アレンジとからだの相関 0.14
「こころ」と「味」は,
相関が高い
こころとからだの相関 0.81
こころと味の相関 0.95
こころと時間の相関 0.63
こころとお金の相関 0.71
こころとアレンジの相関 0.23
味軸に統合
6軸間の相関をとり,その妥当性を確認した.
12
「味」軸の特徴を考慮したレシピ特徴抽出
13
レシピ中の「あっさり(-5)」 「(+5)こってり」
材料,調味料,調理手順で判別することができる
お酢,塩,茹でる,…
あっさり度の高いレシピと,こってり度の高いレシピ数件を
形態素解析し,特徴語をレシピベクトルとして採用する.
あっさり度の高いレシピ
こってり度の高いレシピ
特徴語抽出
特徴語抽出
「あっさり」を表す特徴語
肉汁,油,炒める,…
「こってり」を表す特徴語
レシピ
レシピ
レシピ中の「お疲れ(-5)」 「(+5)元気」
材料,調味料,調理手順で判別することができる
「からだ」軸の特徴を考慮したレシピ特徴抽出
14
お酢,ガーリック,薬膳,…
お疲れ度の高いレシピと,元気度の高いレシピ数件を
形態素解析し,特徴語をレシピベクトルとして採用する.
お疲れ度の高いレシピ
元気度の高いレシピ
特徴語抽出
特徴語抽出
「お疲れ」を表す特徴語
肉汁,ステーキ,焼く,…
「元気」を表す特徴語
レシピ
レシピ
調理動作辞書を作成し,時間のかかり具合を算出.
この時,動詞の数も考慮する.
切る
時間がかかる
蒸す
時間がかからない
お手軽度を
高くする
本格度を
高くする
15
「時間」軸の特徴を考慮したレシピ特徴抽出
材料毎の平均値段表を作成
ステーキ:369円/100g キャベツ:93円/1玉 さんま:125円/1匹
「食品統計」のようなデータを用い、1食あたりの
金額を算出する。
算出された値段を正規化し,-5〜5のデータ値と、
合計金額で出力する。
16
「お金」軸の特徴を考慮したレシピ特徴抽出
17
未知レシピ
入力された未知レシピと同名のレシピを検索し,
そのレシピに頻出する名詞と動詞を取得する.
それを定番メニューとして,Edit Distanceにもとづいて
アレンジ度を算出する.
②アレンジ度の算出
「アレンジ」軸の特徴を考慮したレシピ特徴抽出
レシピ
レシピ
レシピ
レシピ
同名のレシピ
①動詞,名詞を抽出
まとめ
18
マスターレシピとの類似度分析に基づく未知
レシピへのメタデータ自動付与方式の提案
– 6軸(からだ,こころ,味,時間,お金,アレンジ)
ごとに,特徴を調査
– 各軸の特徴を考慮したレシピ特徴ベクトルの抽
出方式を検討
今後の課題
– 評価実験を行い,提案方式の有効性を検証

Más contenido relacionado

Destacado

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by HubspotMarius Sescu
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTExpeed Software
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsPixeldarts
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthThinkNow
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfmarketingartwork
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 

Destacado (20)

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 

Deim2015「各種メタデータの特徴を考慮した未知レシピへのメタデータ自動付与方式」

Notas del editor

  1. 各種メタデータの特徴を考慮した未知レシピへのメタデータ自動付与方式
  2. 近年,レシピの検索・推薦に関する取り組みが盛んに行われている レシピ推薦サービスにおいて,高精度に推薦アイテムの選定を行うためには,各レシピデータを分析し,適切なメタデータを付与することが考えられる. 例えばレシピに,「子供の喜ぶレシピ」というメタデータが付与されていれば,そのようなレシピが検索・推薦しやすくなります. しかし大量のレシピデータに適切なメタデータを人手で付与することは容易ではありません.
  3. そこで本研究では既に人の手によりメタデータが付与されているレシピとの類似度分析に基づいたメタデータ自動付与方式の開発を行う.
  4. 本研究で扱うメタデータは,共同研究者である森下らの「気分で料理を検索するシステム」の「気分で料理がぽん!」で使われた, ユーザの気分に合致するようなメタデータ付与済みのレシピ500件(マスターレシピ)の,メタデータを使う. このメタデータは,「からだ」「こころ」「味」「時間」「お金」「アレンジ」の6つの軸をそれぞれ-5から+5で評価したものであり, 気分で料理がポンとは,ユーザの気分を入力すると,その気分にあったレシピが推薦されるというものであるが,しかし,気分データが付与されているレシピは500件しかないため,数が少ない. そのため,本研究ではそのメタデータを自動付与することを目指している.
  5. 提案手法の開発手順について ①マスターレシピ群の特徴ベクトル抽出を行う ②未知レシピ軍の特徴ベクトルの抽出を行う ③マスターレシピ群に対する未知レシピ群の類似度分析に基づくメタデータ自動付与を行う と言った流れになる
  6. 次にメタデータ自動付与方法を5つ紹介する. なお,グラフは2次元で表記しているが,実際は多次元である. 赤い丸がマスターレシピ群で,灰色のバツが未知レシピである. 一つ目が,メスターレシピの最も類似度の上位のメタデータをそのままコピーしたもの(TOPコピーという).
  7. 2つ目が,マスターレシピの類似度上位3件のメタデータをそれぞれ平均したものをメタデータとして決定し,未知レシピに付与するといったもの.
  8. 3つ目が,マスターレシピの類似度上位3件のメタデータに,類似度順位を考慮した重みを加え,平均したものをメタデータとして決定し,未知レシピに付与するといったもの.
  9. 4つ目が,マスターレシピの類似度上位5件のメタデータをそれぞれ平均したものをメタデータとして決定し,未知レシピに付与するといったもの.
  10. 5つ目が,マスターレシピの類似度上位5件のメタデータに,類似度順位を考慮した重みを加え,平均したものをメタデータとして決定し,未知レシピに付与するといったもの.
  11. これらのメタデータ自動付与方式の妥当性の評価を,先行研究で行った結果,付与されたメタデータの妥当性は十分に高いとはいえないことがわかった. 味軸や時間軸,お金軸などの,全く異なる特徴量を一つのベクトルで表すのは無理があるということが考えられたので,軸ごとの特徴量を個別に抽出する必要があると考えた.
  12. このように,現在のマスターレシピにある,からだ,こころ,味,時間,お金,アレンジの,各軸の特徴を考慮した,次元抽出を行う.
  13. 先行研究では,6軸で研究を行っていたが,各軸の相関をとり,その妥当性を確認したところ,こころ軸と味軸は相関が非常に高い為, メタデータを自動付与しても心軸と味軸は特徴も似ており,ほとんど同じ値が付与されてしまうことになる. よって,こころ軸は味軸に統合して考えることにする.
  14. それでは,各軸の特徴を考慮したレシピ次元算出方法について,1つずつ説明していきます. 味軸は,レシピ中の材料や調味料,調理手順であっさりかこってりかを判別することができます. 例えば,「お酢」や「塩」,「茹でる」などは,あっさりしたレシピに多く登場し,逆に「肉汁」や「油」,「炒める」などはこってりしたレシピに多く登場します. なので,味軸は,マスターレシピのあっさり度の高いレシピ数件と,こってり度の高いレシピ数件から,特徴語を抽出し,レシピベクトルとして採用します.
  15. からだ軸も味軸と同様で,レシピ中の材料や調味料,調理手順であっさりかこってりかを判別することができます. 例えば,「お酢」や「ガーリック」,「薬膳(やくぜん)」などは,お疲れ度の高いレシピに多く登場し,逆に「肉汁」や「ステーキ」,「焼く」などは元気度の高いレシピに多く登場します. なので,からだ軸も,マスターレシピのお疲れ度の高いレシピ数件と,元気度の高いレシピ数件から,特徴語を抽出し,レシピベクトルとして採用します.
  16. 時間軸は,調理動作辞書を作成し,時間のかかり具合を算出します. 例として,「切る」という動詞は比較的時間がかからないため,お手軽度を高くし, 「蒸す」という動詞は,時間がかかるため,本格度を高くします. しかしこのとき,「切る」という動詞が複数回出現した場合,作業に有する時間が増えてしまいます. なので,動詞の個数も考慮して考えます.
  17. お金軸は,食材の値段データを作成し,1食あたりの金額を算出します. マスターレシピの食材を全て値段に置き換え,値段のヒストグラムを作成します. 次に,未知レシピの食材を全て値段に置き換え,そのヒストグラムに当てはめ,データを正規化し,-5〜5のデータの値として出力します. こうすることにより,1食あたりの値段と,今までのお金軸同様の-5〜+5の値の両方をユーザに提示することができます.
  18. アレンジ軸は,「定番メニューからどれだけアレンジされているか」というものを示す軸なので,まずは「定番」の基準を決めなければなりません. なので,入力された未知レシピと同名のレシピをインターネット上で検索し,それぞれから材料や調味料を示す「名詞」と,調理手順を示す「動詞」を抽出し, 頻出するものを定番メニューの比較対象として決定します. 次に,未知レシピから名詞と動詞を抽出し,Edit Distance(レーベンシュタイン距離)にもとづいてアレンジ度を算出し,-5〜5の範囲に正規化して出力します.