SlideShare una empresa de Scribd logo
1 de 40
Descargar para leer sin conexión
Věštění (s) Wikipedií
aneb Má léta s Wikipedií
30. 11. 2013 Josef Šlerka
Sémiotika
sémiotický pohled na svět: „A sign, or representamen,
is something which stands to somebody for something
in some respect or capacity.“ (Ch. S. Peirce)
wikipedia jako ikon (model)
wikipedia jako index (vzorek)
wikipedia jako symbol (součást sémiosféry)
Jak to bylo...
Minulost (WikiAnalyzer)
Blízká minulost (Wikiskop a další lotroviny)
Přítomnost (Digital Humanities)
Bllízká přítomnosti (OPLZZ)
Vzdálenější budoucnost (věštění)
Minulost
aneb jak to všechno začalo...
WikiAnalyzer (2009)
wiki jako základ pro named-entity recognition
wiki jako základ pro základní kategorizaci
wiki jako zaklad pro doporučení
nezávisle na Wikify:-)
WikiAnalyzer (2009)
Text je systém, ve kterém jsou souvislosti mezi větami
dány i tím, že pojmy, které se v textu vyskytují, náleží
ke společnému tématu.
Správné určení tématu (témat) textu je shodné s
nalezením nejvyššího společného slovníku pro co
největší část použitých termínů.
Určení tématu odpovídá přibližně druhému stupni
abstrakce.
Demo
Lidstvo umí odklonit ničivý asteroid. Problém je ho
včas objevit
Lidstvo má schopnosti i vědomosti k tomu, aby
dokázalo odklonit ničivý asteroid prakticky jakékoli
velikosti, pokud ho zaznamená s dostatečným
časovým předstihem. Abychom to ale lidé dokázali,
museli by během několika desítek let do takového
gigantického asteroidu narazit mnoha kosmickými
aparáty....
http://www.novinky.cz/veda-skoly/320670-lidstvo-umi-
Blízká minulost
projekt Wikiskop a jiné lotroviny
Wiki jako materiál
pěkný textový korpus pro další práci
relativně snadno parsrovatelný a tak vděčný materiál
realizovatelné v Google Drive
Indikátor známosti

http://cs.wikipedia.org/wiki/Dominik_Ha%C5%A1ek
=ImportXML(D4, "//div[@id='p-lang']/div/ul")
WikiSkop
výsledek multimediálního projektu studentů
@stunome
Martin Obert, Jiří Suchomel, Vojtěch Novák, Martin
Fryč
projekt realizován v roce 2012
WikiSkop
Cílem projektu Wikiskop je zhotovit vizualizaci hesel o
České republice napříč těmito verzemi. Měli bychom
tak zjistit, jaké informace jsou k dispozici různým
národům. Současně by měla vizualizace také ukázat,
jak se liší zájem o jednotlivé lokality ČR podle
jazykových skupin. Výsledkem projektu by měla být
webová stránka s interaktivní mapou doplněná o
interpretaci případných anomálií a zajímavostí v
jednotlivých jazykových vrstvách. (z popisu projektu)
WikiSkop

http://wikiskop.heroku.com
Přítomnost
Digital Humanities aneb jde to hlouběji?
Wiki - sociální indikátor
může být návštěvnost Wikipedie jedním ze zdrojů pro
předpovídání výsledků voleb?
prezidentské volby pro ČT (ideová spolupráce)
Wiki a volby PSP 2013
dalo se něco vyčíst z návštěvnosti stránek na Wiki
aneb po bitvě je každý generál?
anebo nikdo politici neviděli slona v místnosti?
Blízká přítomnosti
OPPLZ aneb na čem teď pracuji
Dáme práci.eu
párování pracovních míst s nezaměstnanými skrze
sémantická data
kromě vývoje ontologií a mikrodat i problém se
vylepšením výsledků vyhledávání při setkání
nestrukturovaných dat (životopisu) a dat
strukturovaných (poptávka práce)
řešením je opět vylepšený WikiAnalyzer ale
kombinovaný s fulltextovou db Elasticsearch
Vzdálenější
budoucnost
věštění
Může Wiki věštit?
Early Prediction of Movie Box Office Success Based
on Wikipedia Activity Big Data
předpověď úspěchu filmů na základě počtu shlédnutí
stránky a editací stránky filmu a aktivity správců, dále
pak počtu kin, kde byl film nasazen
351 jedna analyzovaných US premiér
Může Wiki věštit?
studie Twitter Anticipates Bursts of Requests for
Wikipedia Articles (Gabriele Tolomei, Salvatore
Orlando)
entity na Twitteru trendují o něoc dříve než na
Wikipedii
Může Wiki věštit?

Jak vypadá takový normální průběh?
RIP Natalja Gorbaněvská
Filipíny
Může Wiki věštit?
otázka: šlo by zkombinovat data z Wikipedie a Twitter
pro kurátorství zpráv na českých serverech?
řekni mi, co je trendy na Wiki a já ti povím co zítra
najdeš v novinách?
Wikipedia + Klábosení + Lajkování = nový agregátor?
A to je všechno...
... zatím:-)
Děkuji za pozornost!
@josefslerka

Más contenido relacionado

Destacado

Český a slovenský Twitter pod lupou
Český a slovenský Twitter pod lupouČeský a slovenský Twitter pod lupou
Český a slovenský Twitter pod lupouJosef Šlerka
 
The Art of Trolling 2.0 For Dummies
The Art of Trolling 2.0 For DummiesThe Art of Trolling 2.0 For Dummies
The Art of Trolling 2.0 For DummiesJosef Šlerka
 
Ways to understand fans - social network analysis
Ways to understand fans - social network analysisWays to understand fans - social network analysis
Ways to understand fans - social network analysisJosef Šlerka
 
The Art of Trolling 2.0
The Art of Trolling 2.0The Art of Trolling 2.0
The Art of Trolling 2.0Josef Šlerka
 
All about Facebook? All about you!
All about Facebook? All about you!All about Facebook? All about you!
All about Facebook? All about you!Josef Šlerka
 
Malý velký svět bublin na Facebooku
Malý velký svět bublin na FacebookuMalý velký svět bublin na Facebooku
Malý velký svět bublin na FacebookuJosef Šlerka
 
Některé obecně rozšířené mýty o Facebooku
Některé obecně rozšířené  mýty o FacebookuNěkteré obecně rozšířené  mýty o Facebooku
Některé obecně rozšířené mýty o FacebookuJosef Šlerka
 
Úvod do studia nových médií
Úvod do studia nových médiíÚvod do studia nových médií
Úvod do studia nových médiíJosef Šlerka
 

Destacado (10)

Český a slovenský Twitter pod lupou
Český a slovenský Twitter pod lupouČeský a slovenský Twitter pod lupou
Český a slovenský Twitter pod lupou
 
The Art of Trolling 2.0 For Dummies
The Art of Trolling 2.0 For DummiesThe Art of Trolling 2.0 For Dummies
The Art of Trolling 2.0 For Dummies
 
Ways to understand fans - social network analysis
Ways to understand fans - social network analysisWays to understand fans - social network analysis
Ways to understand fans - social network analysis
 
Shall we dance
Shall we danceShall we dance
Shall we dance
 
The Art of Trolling 2.0
The Art of Trolling 2.0The Art of Trolling 2.0
The Art of Trolling 2.0
 
All about Facebook? All about you!
All about Facebook? All about you!All about Facebook? All about you!
All about Facebook? All about you!
 
Just metadata
Just metadataJust metadata
Just metadata
 
Malý velký svět bublin na Facebooku
Malý velký svět bublin na FacebookuMalý velký svět bublin na Facebooku
Malý velký svět bublin na Facebooku
 
Některé obecně rozšířené mýty o Facebooku
Některé obecně rozšířené  mýty o FacebookuNěkteré obecně rozšířené  mýty o Facebooku
Některé obecně rozšířené mýty o Facebooku
 
Úvod do studia nových médií
Úvod do studia nových médiíÚvod do studia nových médií
Úvod do studia nových médií
 

Más de Josef Šlerka

Znaky, znaky, modely
Znaky, znaky, modelyZnaky, znaky, modely
Znaky, znaky, modelyJosef Šlerka
 
LLM a mixed methods v humanitních vědách
LLM a mixed methods v humanitních vědáchLLM a mixed methods v humanitních vědách
LLM a mixed methods v humanitních vědáchJosef Šlerka
 
Vliv AI na mediální trh
Vliv AI na mediální trhVliv AI na mediální trh
Vliv AI na mediální trhJosef Šlerka
 
Informační věda - Pravděpodobnosti
Informační věda - PravděpodobnostiInformační věda - Pravděpodobnosti
Informační věda - PravděpodobnostiJosef Šlerka
 
Informacni veda: Pocitace
Informacni veda: PocitaceInformacni veda: Pocitace
Informacni veda: PocitaceJosef Šlerka
 
Inforamační věda: Algoritmus
Inforamační věda: AlgoritmusInforamační věda: Algoritmus
Inforamační věda: AlgoritmusJosef Šlerka
 
Co je to datova novinarina
Co je to datova novinarinaCo je to datova novinarina
Co je to datova novinarinaJosef Šlerka
 
Algoritmy a sociální sítě - stručný úvod
Algoritmy a sociální sítě - stručný úvodAlgoritmy a sociální sítě - stručný úvod
Algoritmy a sociální sítě - stručný úvodJosef Šlerka
 
Parallel Polis Revisited: Way from concept of Parallel Polis to Distributed R...
Parallel Polis Revisited: Way from concept of Parallel Polis to Distributed R...Parallel Polis Revisited: Way from concept of Parallel Polis to Distributed R...
Parallel Polis Revisited: Way from concept of Parallel Polis to Distributed R...Josef Šlerka
 
Dezinformační weby a zpravodajství v ČR
Dezinformační weby a zpravodajství v ČRDezinformační weby a zpravodajství v ČR
Dezinformační weby a zpravodajství v ČRJosef Šlerka
 
INFOWAR IN CZECH REPUBLIC
INFOWAR IN CZECH REPUBLICINFOWAR IN CZECH REPUBLIC
INFOWAR IN CZECH REPUBLICJosef Šlerka
 
Česká média dnes aneb Pokus o kontext k aktuální debatě
Česká média dnes aneb Pokus o kontext k aktuální debatěČeská média dnes aneb Pokus o kontext k aktuální debatě
Česká média dnes aneb Pokus o kontext k aktuální debatěJosef Šlerka
 
Svět viděný cizíma očima
Svět viděný cizíma očimaSvět viděný cizíma očima
Svět viděný cizíma očimaJosef Šlerka
 
Do Birds of a Feather Flock Together?
Do Birds of a Feather Flock Together?Do Birds of a Feather Flock Together?
Do Birds of a Feather Flock Together?Josef Šlerka
 
Projekt Navigátor - datová část
Projekt Navigátor - datová částProjekt Navigátor - datová část
Projekt Navigátor - datová částJosef Šlerka
 
Stručná zpráva o jednom experimentu
Stručná zpráva o jednom experimentuStručná zpráva o jednom experimentu
Stručná zpráva o jednom experimentuJosef Šlerka
 
Wikipedie ve službách zla?!
Wikipedie ve službách zla?!Wikipedie ve službách zla?!
Wikipedie ve službách zla?!Josef Šlerka
 

Más de Josef Šlerka (20)

Znaky, znaky, modely
Znaky, znaky, modelyZnaky, znaky, modely
Znaky, znaky, modely
 
LLM a mixed methods v humanitních vědách
LLM a mixed methods v humanitních vědáchLLM a mixed methods v humanitních vědách
LLM a mixed methods v humanitních vědách
 
Vliv AI na mediální trh
Vliv AI na mediální trhVliv AI na mediální trh
Vliv AI na mediální trh
 
Informační věda - Pravděpodobnosti
Informační věda - PravděpodobnostiInformační věda - Pravděpodobnosti
Informační věda - Pravděpodobnosti
 
Informacni veda: Pocitace
Informacni veda: PocitaceInformacni veda: Pocitace
Informacni veda: Pocitace
 
Inforamační věda: Algoritmus
Inforamační věda: AlgoritmusInforamační věda: Algoritmus
Inforamační věda: Algoritmus
 
Co je to datova novinarina
Co je to datova novinarinaCo je to datova novinarina
Co je to datova novinarina
 
Algoritmy a sociální sítě - stručný úvod
Algoritmy a sociální sítě - stručný úvodAlgoritmy a sociální sítě - stručný úvod
Algoritmy a sociální sítě - stručný úvod
 
Atlas konspirací
Atlas konspiracíAtlas konspirací
Atlas konspirací
 
Parallel Polis Revisited: Way from concept of Parallel Polis to Distributed R...
Parallel Polis Revisited: Way from concept of Parallel Polis to Distributed R...Parallel Polis Revisited: Way from concept of Parallel Polis to Distributed R...
Parallel Polis Revisited: Way from concept of Parallel Polis to Distributed R...
 
Dezinformační weby a zpravodajství v ČR
Dezinformační weby a zpravodajství v ČRDezinformační weby a zpravodajství v ČR
Dezinformační weby a zpravodajství v ČR
 
INFOWAR IN CZECH REPUBLIC
INFOWAR IN CZECH REPUBLICINFOWAR IN CZECH REPUBLIC
INFOWAR IN CZECH REPUBLIC
 
Česká média dnes aneb Pokus o kontext k aktuální debatě
Česká média dnes aneb Pokus o kontext k aktuální debatěČeská média dnes aneb Pokus o kontext k aktuální debatě
Česká média dnes aneb Pokus o kontext k aktuální debatě
 
Svět viděný cizíma očima
Svět viděný cizíma očimaSvět viděný cizíma očima
Svět viděný cizíma očima
 
Do Birds of a Feather Flock Together?
Do Birds of a Feather Flock Together?Do Birds of a Feather Flock Together?
Do Birds of a Feather Flock Together?
 
Projekt Navigátor - datová část
Projekt Navigátor - datová částProjekt Navigátor - datová část
Projekt Navigátor - datová část
 
AI a žurnalistika
AI a žurnalistikaAI a žurnalistika
AI a žurnalistika
 
Stručná zpráva o jednom experimentu
Stručná zpráva o jednom experimentuStručná zpráva o jednom experimentu
Stručná zpráva o jednom experimentu
 
Volba a metoda
Volba a metodaVolba a metoda
Volba a metoda
 
Wikipedie ve službách zla?!
Wikipedie ve službách zla?!Wikipedie ve službách zla?!
Wikipedie ve službách zla?!
 

Věštění (s) Wikipedií

  • 1. Věštění (s) Wikipedií aneb Má léta s Wikipedií 30. 11. 2013 Josef Šlerka
  • 2. Sémiotika sémiotický pohled na svět: „A sign, or representamen, is something which stands to somebody for something in some respect or capacity.“ (Ch. S. Peirce) wikipedia jako ikon (model) wikipedia jako index (vzorek) wikipedia jako symbol (součást sémiosféry)
  • 3. Jak to bylo... Minulost (WikiAnalyzer) Blízká minulost (Wikiskop a další lotroviny) Přítomnost (Digital Humanities) Bllízká přítomnosti (OPLZZ) Vzdálenější budoucnost (věštění)
  • 4. Minulost aneb jak to všechno začalo...
  • 5. WikiAnalyzer (2009) wiki jako základ pro named-entity recognition wiki jako základ pro základní kategorizaci wiki jako zaklad pro doporučení nezávisle na Wikify:-)
  • 6. WikiAnalyzer (2009) Text je systém, ve kterém jsou souvislosti mezi větami dány i tím, že pojmy, které se v textu vyskytují, náleží ke společnému tématu. Správné určení tématu (témat) textu je shodné s nalezením nejvyššího společného slovníku pro co největší část použitých termínů. Určení tématu odpovídá přibližně druhému stupni abstrakce.
  • 7. Demo Lidstvo umí odklonit ničivý asteroid. Problém je ho včas objevit Lidstvo má schopnosti i vědomosti k tomu, aby dokázalo odklonit ničivý asteroid prakticky jakékoli velikosti, pokud ho zaznamená s dostatečným časovým předstihem. Abychom to ale lidé dokázali, museli by během několika desítek let do takového gigantického asteroidu narazit mnoha kosmickými aparáty.... http://www.novinky.cz/veda-skoly/320670-lidstvo-umi-
  • 8.
  • 10. Wiki jako materiál pěkný textový korpus pro další práci relativně snadno parsrovatelný a tak vděčný materiál realizovatelné v Google Drive
  • 12.
  • 13. WikiSkop výsledek multimediálního projektu studentů @stunome Martin Obert, Jiří Suchomel, Vojtěch Novák, Martin Fryč projekt realizován v roce 2012
  • 14. WikiSkop Cílem projektu Wikiskop je zhotovit vizualizaci hesel o České republice napříč těmito verzemi. Měli bychom tak zjistit, jaké informace jsou k dispozici různým národům. Současně by měla vizualizace také ukázat, jak se liší zájem o jednotlivé lokality ČR podle jazykových skupin. Výsledkem projektu by měla být webová stránka s interaktivní mapou doplněná o interpretaci případných anomálií a zajímavostí v jednotlivých jazykových vrstvách. (z popisu projektu)
  • 16.
  • 17.
  • 18.
  • 20. Wiki - sociální indikátor může být návštěvnost Wikipedie jedním ze zdrojů pro předpovídání výsledků voleb? prezidentské volby pro ČT (ideová spolupráce)
  • 21. Wiki a volby PSP 2013 dalo se něco vyčíst z návštěvnosti stránek na Wiki aneb po bitvě je každý generál? anebo nikdo politici neviděli slona v místnosti?
  • 22.
  • 23.
  • 24.
  • 25.
  • 26.
  • 27. Blízká přítomnosti OPPLZ aneb na čem teď pracuji
  • 28. Dáme práci.eu párování pracovních míst s nezaměstnanými skrze sémantická data kromě vývoje ontologií a mikrodat i problém se vylepšením výsledků vyhledávání při setkání nestrukturovaných dat (životopisu) a dat strukturovaných (poptávka práce) řešením je opět vylepšený WikiAnalyzer ale kombinovaný s fulltextovou db Elasticsearch
  • 30. Může Wiki věštit? Early Prediction of Movie Box Office Success Based on Wikipedia Activity Big Data předpověď úspěchu filmů na základě počtu shlédnutí stránky a editací stránky filmu a aktivity správců, dále pak počtu kin, kde byl film nasazen 351 jedna analyzovaných US premiér
  • 31.
  • 32. Může Wiki věštit? studie Twitter Anticipates Bursts of Requests for Wikipedia Articles (Gabriele Tolomei, Salvatore Orlando) entity na Twitteru trendují o něoc dříve než na Wikipedii
  • 33.
  • 34. Může Wiki věštit? Jak vypadá takový normální průběh?
  • 35.
  • 38. Může Wiki věštit? otázka: šlo by zkombinovat data z Wikipedie a Twitter pro kurátorství zpráv na českých serverech? řekni mi, co je trendy na Wiki a já ti povím co zítra najdeš v novinách? Wikipedia + Klábosení + Lajkování = nový agregátor?
  • 39. A to je všechno... ... zatím:-)