Sandra Fauconnier & Maarten Dammers Barbara Dierickx, Bert …… · 2016. 4. 12. · Barbara...

Preview:

Citation preview

Linked Open Data via Wikidata

Barbara Dierickx, Bert Lemmens, Alina SaenkoSandra Fauconnier & Maarten Dammers

29/01/2016 - Brussel

AGENDA 29/01/16● Stand van zaken realisaties

● Volgende stappen

● Accounts aanmaken

○ LUNCH

● Hands-on Wikidata!

● Zoeken-aanpassen-toevoegen

● Data bekijken/volgen/bevragen

Vragen? Gewoon tussendoor

PROJECTPLAN: HET IDEE

PROJECTPLAN: WIE DEED WAT?

De projectpartners (data-leveranciers)

PACKED vzw

WIKI-MEDEWERKERS

PROJECTPLAN: DE ACTIES

1. PACKED schrijft een whitepaper* over Wikidata (hoe data toevoegen aan Wikidata, wat zijn voordelen Wikidata voor jouw instelling, # best practices).

2. De deelnemende partners bezorgen PACKED een CSV-dataset met daarin o.a. de aangemaakte PIDs voor hun kunstwerken.

3. Deze dataset wordt onder een CC0-licentie opgeladen in Wikidata en vervolgens wordt de informatie uit die set gebruikt op verschillende Wiki-kanalen (o.a. Wikipedia)

4. De partners krijgen een RDF-export terug van hun aangeleverde data.*whitepaper: een document dat beschrijft hoe beleid, een technologie, en/of product een specifiek probleem oplost. Dergelijke paper wordt gebruikt om de lezer van objectieve relevante informatie te voorzien met het oog op het nemen van een beslissing.

PROJECTPLAN: WIKIGEMEENSCHAP

PROJECTPLAN: WIKIGEMEENSCHAP

Sandra Fauconnier, projectmedewerkerFoto: Eneasmx, CC-BY-SA 4.0

Maarten Dammers, upload-vrijwilligerFoto: Sarah Stierch, CC-BY 4.0

DE UPLOADCIJFERS

Op Wikidata staan nu 26.680 kunstwerken uit ‘jullie’ musea. In oktober waren dat er 65. (Wikidata heeft 10.453 items uit Nederlandse collecties.)

● Die 26.680 kunstwerken zijn gemaakt door 3.615 kunstenaars. Daarvan zijn enkele honderden kunstenaars voor het project nieuw op Wikidata ingevoerd.

● We hebben 399 verschillende objectnamen uit jullie collecties gemapt met begrippen op Wikidata. Van acrylschilderij tot zwart-witfoto.

UPLOADCIJFERS vs. AANBOD CSVrecords in csv items op Wikidata

KMSKA 7.799 7.798

Groeningemuseum 2.858 2.859

MSK Gent 6.973 6.973

Mu.ZEE 3.979 3.978

S.M.A.K. 2.579 1.934

M - Museum Leuven 4.727 3.137

VKC 2.537 3

CVG 1.933 2

EEN NIEUW ITEM OP WIKIDATA

● Scenario 1: voorbeeld van een nieuw record (from scratch) op basis van de aangeleverde data, op Wikidata

● https://www.wikidata.org/wiki/Q22262262 ● ‘Kleine bewegingen (1-24), Robert Devriendt, S.M.A.K. / CVG

EEN BESTAAND ITEM AANGEVULD

● Scenario 2: voorbeeld van een reeds bestaand record in Wikidata dat op basis van de aangeleverde data verder aangevuld werd

● https://www.wikidata.org/wiki/Q2480921● Madonna met kanunnik Joris Van der Paele, Jan Van Eyck,

Groeningemuseum / VKC

BIJZONDERHEDEN

● Datering =/ ISO● Reeks/deel van● (Quasi) doublure ● Kopie● Anonieme meester● Materiaal/techniek● Principesverdeling in materiaal & type bij object type

BIJZONDERHEDEN: DATERING

Wikidata accepteert momenteel data met een nauwkeurigheidsgraad van dag, maand, jaar, decennium, eeuw of millennium.

In veel gevallen moet de datum vereenvoudigd of ‘verbreed’ worden. In sommige gevallen is het niet mogelijk om deze correct in Wikidata in te voeren. Voorbeeld:● ‘Tussen 1850 en 1899’ wordt vereenvoudigd naar ‘19de eeuw’● ‘Tussen 1744 en 1747’ wordt vereenvoudigd naar ‘1740s● ‘Tussen 1887 en 1909’ kan eigenlijk niet correct op Wikidata ingevoerd worden; dit is

niet te herleiden naar een exact decennium of eeuw.

Betekent ook dat Wikidata (nog) niet alle finesses van ISO 8601-notaties ondersteunt.Sandra heeft hierover een discussie gestart op Wikidata. Wordt hopelijk opgepikt.

DATERING, EEN VOORBEELD

https://www.wikidata.org/wiki/Q21615081

BIJZONDERHEDEN: REEKS/DEEL VAN

Voorbeeld van drieluik waarvan drie delen zich in dezelfde collectie bevinden: drieluik Landverhuizers van Eugène Laermans, collectie KMSKA.

Het item voor het drieluik: https://www.wikidata.org/wiki/Q21618967Linkerpaneel (Naar de haven): https://www.wikidata.org/wiki/Q21618970 Middenpaneel (Laatste blik): https://www.wikidata.org/wiki/Q21618969

Rechterpaneel (Afscheid): https://www.wikidata.org/wiki/Q21618968

BIJZONDERHEDEN: KOPIE

Eigenlijk is het op Wikidata gewenst om informatie rond de maker zeer accuraat weer te geven.In het project is best veel data aangeleverd als volgt (semi-fictieve voorbeelden):1. Schilderij ‘Hemelvaart van Maria’ met makers Peter Paul Rubens en Paulus Pontius.

Terwijl het eigenlijk gaat om een schilderij door een anoniem kunstenaar, naar een prent van Paulus Pontius, die een werk van Rubens vertaald heeft naar een prent.

2. Schilderij ‘Kanunnik van der Paele’ door Jan van Eyck, terwijl het eigenlijk gaat om een ‘getrouwe kopie’ naar het werk van Jan van Eyck: https://www.wikidata.org/wiki/Q21614713. Het ‘echte’ werk: https://www.wikidata.org/wiki/Q2480921

Op Wikidata willen we deze laatste (correcte) informatie opslaan.

BIJZONDERHEDEN: ANONIEMPJES

Kunstwerken van onbekende en anonieme makers worden op Wikidata alle aangeduid met de eigenschap Creator: anonymous (https://www.wikidata.org/wiki/Q4233718)

Voor naamloze maar wel als specifieke individuen geidentificeerde makers bestaan wel specifieke items, bijvoorbeeld de Meester van de Familie van de Heilige Anna (https://www.wikidata.org/wiki/Q18516727). Ook bekende monogrammisten, van wie de naam verder onbekend is, hebben een eigen item, zoals bijvoorbeeld de Braunschweiger Monogrammist: https://www.wikidata.org/wiki/Q541119.

BIJZONDERHEDEN: MATERIAAL/TECHNIEK

Principes:

1. Sommige musea hanteren gebruikte materiaal (bv. ‘brons’) als objectnaam. Op Wikidata wordt daar anders mee omgegaan: bij ‘instance of’ wordt steeds breedste typering van kunstwerk opgenomen (bv. schilderij / sculptuur / tekening / installatie e.d.). Via extra properties wordt vervolgens meer verteld over specifiek materiaal of techniek. Een potloodtekening wordt ingevoerd als ‘instance of: drawing + material used: pencil’. Een brons als ‘instance of: sculpture’ + ‘material used: bronze’.

2. Bovenstaande werkwijze is niet definitief! Wikidata-community is nog jong en scherpt continu werkwijze aan. Goed mogelijk dat in toekomst items van kunstwerken uit deelnemende musea op Wikidata aan nieuwe consensus aangepast zullen worden.

Zie GoogleSheet (Handboek)

OPEN ISSUES

● Geen actieve resolver = schrapping van je reference!● Plaats(ing) van de PIDs

○ Data in Wikidata? = OK. Waar zitten de PIDs? = discussie

● Vragen:○ Waarom is er geen specifiek veld voor de WorkPID?

bvb ‘Work ID’ = ‘een persistent ID/URI voor een kunstwerk’ met een attribuut dat de naam van de autoriteit aangeeft (KMSKA, Europeana, CONA)

○ Activeert Collectie Vlaamse Gemeenschap ook eigen DataPIDs?○ Moet het veld inventory number zowel het ID van het museum als CVG hebben?

DATA UPLOAD - BOT

● Grootste load: via bot van Maarten (Multichill)

DATA UPLOAD - (min of meer) HANDMATIG

Zelf grotere hoeveelheden items toevoegen (bijvoorbeeld nieuwe aanwinsten)?

1. Tot een paar tiental: kan prima met de hand, 1 voor 1

2. Tot een paar honderden: via QuickStatements tool https://tools.wmflabs.org/wikidata-todo/quick_statements.php

MOGELIJKHEDEN RDF EXPORT (I)

Van individueel item: actuele info op https://www.wikidata.org/wiki/Wikidata:Data_access

Op itemniveau biedt Wikidata oa RDF-exports in verschillende formaten (.json, .rdf, .tt. en.nt). Indien men het Q-nummer van een item kent, dan kan men eenvoudig deze formaten opvragen. Pas op: Onderstaande links leiden naar soms zware downloads!

Zo is een export van Man met Romeinse munt van Hans Memling (https://www.wikidata.org/wiki/Q3937422) te downloaden als:● json http://www.wikidata.org/wiki/Special:EntityData/Q3937422.json ● rdf http://www.wikidata.org/wiki/Special:EntityData/Q3937422.rdf ● ttl http://www.wikidata.org/wiki/Special:EntityData/Q3937422.ttl ● nt http://www.wikidata.org/wiki/Special:EntityData/Q3937422.nt

MOGELIJKHEDEN RDF EXPORT (II)

Van Wikidata als geheel, actuele info: https://www.wikidata.org/wiki/Wikidata:Database_download/en

Van alle Wikidata-items worden regelmatig dumps gepubliceerd in JSON, XML en RDF formaat. RDF dumps zijn te vinden op https://dumps.wikimedia.org/wikidatawiki/entities/

MOGELIJKHEDEN RDF EXPORT (III)Specifieke sets opvragen: via SPARQL

Maak een lijstje met titels en inventarisnummers van kunstwerken uit het Groeningemuseum:SELECT ?Qnr ?invnr ?title # geef een lijstje met Q-nummersWHERE{ ?Qnr wdt:P195 wd:Q1948674 . # vind alle items in wikidata die behoren tot de collectie van Groeningemuseum SERVICE wikibase:label {

bd:serviceParam wikibase:language "nl" .?Qnr rdfs:label ?title . # toon de titel in het Nederlands

} ?Qnr wdt:P217 ?invnr . # toon het inventarisnummer}

Maak een lijstje met links (datapids) naar werken van Anne-Mie Van Kerckhoven in alle collectie:SELECT ?Qnr ?collectieLabel ?invnr ?datapidWHERE{ ?Qnr wdt:P170 wd:Q527373 . # vind alle werken van Anne-Mie Van Kerckhoven in Wikidata ?Qnr wdt:P195 ?collectie .

SERVICE wikibase:label {bd:serviceParam wikibase:language "nl" . # toon de naam van de collectie waarin het werk zich bevindt in het Nederlands

} ?Qnr wdt:P217 ?invnr . # toon het inventarisnummer ?Qnr wdt:P973 ?datapid # toon de links (datapid) voor die collectie}

WAT MET RDF EXPORT?

Kan terechtkomen op verschillende kanalen:

● Je eigen website - pagina met bevraagbare data: bv. http://www.tate.org.uk/about/our-work/digital/collection-data

● PACKED Github● Open Data Vlaanderen of http://data.gov.

be/nl ● Neem het op in je eigen communicatie!

HOE HOU JE ALLES UP-TO-DATE?

● Resolver activeren● Nieuwe aanwinsten: in resolver registreren (zie Handboek Data-uitgever!)● Stel een data-uitgever aan en formaliseer dit

-> Wikidata is slechts 1 manier: deze stappen zijn noodzakelijk in je hele digitale plan (incl. vervolgend Datahub- of ander project)

-> Nu publiceren op Wikidata betekent infrastructuur operationeel maken en direct kunnen gebruiken

● Toevoegen/actualiseren op Wikidata (leren we deze namiddag)● Hoe kan je RDF-export actueel houden (automatisch?)

VISUALISA-TIES (I)

VISUALISA-TIES (II)

VISUALISA-TIES (III)

NEXT STEPS: PACKED vzw

● Release Handboek ‘Wikidata voor collectiebeheerders’: 10 dagen feedbacktijd● Schrijven eindrapport, incl. suggesties voor de Wikicommunity. Input is welkom! ● Open Belgium conference: presentatie project (ook op Wikimania conferentie wordt

project voorgesteld, door Maarten&Sandra)● Alle materialen, incl. eindrapport, publiceren op Wikiplatformen zodat anderen hier

kunnen uit leren - een projectmodel● Duurzame koppelingen-project

NEXT STEPS: PARTNERS

● Aandacht voor de publieke kant van project: interesse in Sum of all Paintings, edit-a-thons, Wiki loves Art

● Eigen communicatie!● (Ontwikkel)project op basis van Wikidata (catalogus, app, game …) als testbed of

case○ kan dienen ter voorbereiding Datahub ○ denkoefening die wij hebben doorgemaakt ivm inzetten PIDs

En … een beelddonatie (?)/(!)

NEXT STEPS: WIKIDATA● Creators aanvullen. Een aantal mensen invoeren op Wikidata, een aantal meer ‘vlees op de

botten’ geven (geboorte/sterfdatum/plaats, beroep…, authority links)● Dateringen aanvullen en corrigeren. Nu grotendeels enkel precieze dateringen ingevoerd● Reeksen/samengestelde kunstwerken en hun delen correct modelleren● Materialen en extra ‘instance of’ statements aanvullen op basis van oorspronkelijke

datasets● De virtuele collecties goed invoeren: VKC, CVG● Oude, foute PIDs corrigeren (eerste upload KMSKA; foutjes bij M)● Nieuwe identifier-properties voorstellen per collectie, van zodra de links ergens concreet

heen wijzen● Toeschrijvingen corrigeren (‘kopie van een werk Jan van Eyck’ =/ werk Jan van Eyck!)

WORKSHOP WIKIDATA

Accounts aanmaken! (heeft iemand al een account?)

-> Maar eerst iets eten :)

Opdrachten namiddag / beginners1. Zoek je eigen museum en collectie op Wikimedia Commons en voeg een

afbeelding toe2. Zoek op Wikidata een item uit je collectie waar vrijwilligers reeds aan gewerkt

hebbena. Een stroopwafel voor wie een flagrante fout vindt!b. Corrigeer / vul informatie aan waar nodig/gewenst

3. Niet-notable item invoeren van collectie M Leuven; aan het einde van de dag gooien we dit weg

4. Hoe werk je met een volglijst?5. Bekijk de RDF-versie van een van de kunstwerken uit je collectie. Welke

informatie vind je daarin het interessantst?

https://etherpad.wikimedia.org/p/

WikiDataBxl

Opdrachten namiddag / gevorderden1. Hoe doe je eenvoudige queries op Wikidata (het is echt niet moeilijk)?2. Hoe maak je dit soort lijsten? https://www.wikidata.org/wiki/Wikidata:

Flemish_art_collections,_Wikidata_and_Linked_Open_Data/KMSKA

En als er vraag naar is o.a.:

QuickStatements

Mix ‘n’ Match

Tabernacle

VRAGEN / VARIA

~~ EINDE ~~

Recommended