Infoboks - Infobox

En ekte infoboks fra British Rail Class 43- bil 43185 som drives av First Great Western

På wiki er en infoboks en tabell som brukes til å samle og presentere et delsett med informasjon om emnet, for eksempel et dokument . Det er et strukturert dokument som inneholder et sett med attributt -verdipar , og representerer i Wikipedia en oppsummering av informasjon om emnet for en artikkel . På denne måten er de sammenlignbare med datatabeller i noen aspekter. Når den presenteres i det større dokumentet, oppsummeres den, en infoboks presenteres ofte i et sidefeltformat .

En infoboks kan implementeres i et annet dokument ved å transskludere den til det dokumentet og spesifisere noen eller alle attributt -verdi -parene som er knyttet til infoboksen, kjent som parameterisering .

Wikipedia

En infoboks kan brukes til å oppsummere informasjonen i en artikkel på Wikipedia . De brukes på lignende artikler for å sikre konsistens i presentasjonen ved å bruke et vanlig format. Opprinnelig ble infobokser (og maler generelt) brukt til sideoppsett . En infoboks kan transskluderes til en artikkel ved å spesifisere verdien for noen eller alle dens parametere . Parameternavnet som brukes må være det samme som det som er angitt i infoboksmalen, men en hvilken som helst verdi kan være knyttet til det. Navnet er avgrenset fra verdien med et likhetstegn . Parameternavnet kan betraktes som et attributt for artikkelen.

{{Infobox prepared food
| name             =
| image            =
| imagesize        =
| caption          =
| alternate_name   =
| country          =
| region           =
| creator          =
| course           =
| type             =
| served           =
| main_ingredient  =
| variations       =
| calories         =
| other            =
}}

{{Infobox prepared food
| name             = Crostata
| image            = Crostata limone e zenzero 3.jpg
| imagesize        =
| caption          = Crostata with lemon ginger filling
| alternate_name   = 
| country          = [[Italy]]
| region           = [[Lombardia]]
| creator          = 
| course           = [[Dessert]]
| type             = [[Tart]]
| served           = 
| main_ingredient  = Pastry crust, [[jam]] or [[ricotta]], fruit
| variations       = ''Crostata di frutta'', ''crostata di ricotta'', many other sweet or savoury variations
| calories         = 
| other            = 
}}

Infoboksen info tilberedt mat brukes på Wikipedia mat-relaterte artikler, med ingen verdier som er angitt for de parametere (attributter).

Den samme infoboksen som implementert i artikkelen crostata . Vær oppmerksom på at verdier er til høyre for likhetstegnet (=), og at parameternavnene er de samme som i spesifikasjonen for infoboksmalen. Verdiene er i wiki -oppsett : oppføringer som er lagt inn i firkantede parenteser (f.eks. [[Tart]]) blir gjengitt som en lenke til den respektive Wikipedia -artikkelen (f.eks. Tart ), og den koblede filen vil bli transkludert i artikkelen i stedet for markup.

Infoboksen for Wikipedia -artikkelen Crostata gjengitt av en nettlesermotor på en stasjonær datamaskin

Taxoboksen (forkortelse for taksonomi -infoboks) for Wikipedia -artikkelen Xuanhanosaurus gjengitt av en nettlesermotor (på Safari ) på en stasjonær datamaskin ( iMac ). En taxoboks er en type infoboks som beskriver taksonomien til en bestemt livsform eller et dyr

På Wikipedia blir en infoboks omsluttet til en artikkel ved å omslutte navn og attributt -verdi -par i et dobbelt sett med seler . Den Mediawiki -programvaren som Wikipedia opererer deretter analyserer dokumentet, som infoboksen og andre maler behandles av en mal prosessor . Dette er en malmotor som produserer et webdokument og et stilark som brukes til presentasjon av dokumentet. Dette gjør at utformingen av infoboksen kan skilles fra innholdet den manipulerer; det vil si at utformingen av malen kan oppdateres uten å påvirke informasjonen i den, og det nye designet vil automatisk spre seg til alle artikler som transskluderer infoboksen. Vanligvis er infobokser formatert til å vises øverst til høyre i en Wikipedia-artikkel i skrivebordsvisningen, eller øverst i mobilvisningen.

Plassering av en infoboks i wikitext av en artikkel er viktig for tilgjengelighet . En beste praksis er å plassere dem etter disambigueringsmaler (de som henviser lesere til artikler om emner med lignende navn) og vedlikeholdsmaler (for eksempel det som markerer en artikkel som referanseløs), men før alt annet innhold .

Baeza-Yates og King sier at noen redaktører synes maler som infobokser er kompliserte, ettersom malen kan skjule tekst om en eiendom eller ressurs som redaktøren ønsker å endre; dette forverres av lenkete maler, det vil si maler transskludert i andre maler.

Fra august 2009 brukte engelsk Wikipedia omtrent 3000 infoboksmaler som samlet brukte mer enn 20 000 attributter. Siden den gang har mange blitt slått sammen for å redusere redundans. Per juni 2013 var det minst 1,345,446 ingar i morselskapet Infoboksmal , som brukes av noen, men ikke alle, annonse, på 4,251,127 artikler.

Navnet på en infoboks er vanligvis "Infobox [sjanger]"; Imidlertid kan mye brukte infobokser tildeles kortere navn, for eksempel "taxobox" for taksonomi.

Maskinlæring

Omtrent 44,2% av Wikipedia-artiklene inneholdt en infoboks i 2008, og omtrent 33% i 2010. Automatisert semantisk kunnskapsuttrekking ved hjelp av maskinlæringsalgoritmer brukes til å "trekke ut maskinbehandlingsbar informasjon til en relativt lav kompleksitetskostnad". Den lave dekningen gjør det imidlertid vanskeligere, selv om dette delvis kan overvinnes ved å komplettere artikkeldata med de i kategorier der artikkelen er inkludert. Den franske Wikipedia startet prosjektet Infobox versjon 2 i mai 2011.

Kunnskap innhentet ved maskinlæring kan brukes til å forbedre en artikkel, for eksempel ved å bruke automatiserte programvareforslag til redaktører for å legge til infoboksdata. IPopulator -prosjektet opprettet et system for å tilføre en verdi til en artikkels infobox -parameter via en automatisk analyse av teksten til den artikkelen.

DBpedia bruker strukturert innhold hentet fra infobokser med maskinlæringsalgoritmer for å lage en ressurs med koblede data i det semantiske nettet ; det har blitt beskrevet av Tim Berners-Lee som "en av de mer kjente" komponentene i det koblede dataprosjektet.

Maskinekstraksjon skaper en trippel bestående av et emne, predikat eller relasjon og objekt. Hvert attributt-verdi-par i infoboksen brukes til å lage en RDF- setning ved hjelp av en ontologi . Dette blir lettere av det smalere gapet mellom Wikipedia og en ontologi enn det som eksisterer mellom ustrukturert eller fri tekst og en ontologi.

Det semantiske forholdet mellom subjekt og objekt blir etablert av predikatet. I eksempelboksen angir trippelen ("crostata", type, "terte") at en crostata er en type terte . Artikkelens emne brukes som emne, parameternavnet brukes som predikat, og parameterens verdi som objekt. Hver type infoboks tilordnes en ontologiklasse, og hver egenskap (parameter) i en infoboks tilordnes en ontologi -egenskap. Disse tilordningene brukes når du analyserer en Wikipedia -artikkel for å trekke ut data.

Sitater

Generelle referanser

Baeza-Yates, Ricardo; King, Irwin, red. (2009). Vevingstjenester og mennesker på World Wide Web . Springer. ISBN 9783642005695. LCCN 2009926100 .
Broughton, John (2008-07-14). Barber, Nan; Meyers, Peter (red.). Wikipedia - Den manglende håndboken . O'Reilly Media . ISBN 9780596553777.
Geertman, Stan; Reinhardt, Wolfgang; Toppen, Fred, red. (2011). Fremme av geoinformasjonsvitenskap for en verden i endring . Forelesningsnotater i geoinformasjon og kartografi. 1 . Springer. doi : 10.1007/978-3-642-19789-5 . ISBN 9783642197888. ISSN 1863-2246 . LCCN 2011925152 .
Lange, Dustin; Böhm, Christoph; Naumann, Felix (2010). Trekke ut strukturert informasjon fra Wikipedia -artikler for å fylle infobokser . Technische Berichte des Hasso-Plattner-Instituts für Softwaresystemtechnik an der Universität Potsdam, Hasso-Plattner-Institut für Softwaresystemtechnik Potsdam . Universitätsverlag Potsdam. ISBN 9783869560816.
Yu, Liyang (2011). En utviklerveiledning for det semantiske nettet . Springer. doi : 10.1007/978-3-642-15970-1 . ISBN 9783642159695.
Miller, Paul (2008-02-07). "Sir Tim Berners-Lee snakker med Talis om det semantiske nettet" . Transkripsjon av CastingWords. Talis Group. Arkivert fra originalen 2013-05-10 . Hentet 2013-06-02 .
Virvou, Maria; Matsuura, Saeko, red. (2012). Kunnskapsbasert programvareutvikling: Prosedyrer fra den tiende felles konferansen om kunnskapsbasert programvareteknikk . Grenser og kunstig intelligens og applikasjoner . 240 . IOS Press. ISBN 9781614990932. LCCN 2012943674 .

Videre lesning

Kiran, Kumar N .; Santosh, GSK; Varma, Vasudeva (juni 2011). "Flerspråklig dokumentgruppering som bruker Wikipedia som ekstern kunnskap" . Tverrfaglig informasjonsinnhenting . Forelesningsnotater i informatikk. Springer Berlin Heidelberg. 6653 . doi : 10.1007/978-3-642-21353-3 . ISBN 9783642213533. ISSN 0302-9743 . S2CID 9901886 .
Chutiporn, Anutariya; Domingue, John, red. (2008). The Semantic Web: 3rd Asian Semantic Web Conference, ASWC 2008, Bangkok, Thailand, 8.-11. desember 2008. Prosedyrer . Forelesningsnotater i informatikk . 5367 . Springer. ISBN 9783540897033. ISSN 0302-9743 .
Wu, Fei; Hoffmann, Ralph; Weld, Daniel s. (2008). "Informasjonsuttrekking fra Wikipedia: beveger seg nedover den lange halen". Prosedyrer fra den 14. ACM SIGKDD internasjonale konferansen om kunnskapsoppdagelse og datautvinning . Association for Computing Machinery : 731–739. doi : 10.1145/1401890.1401978 . ISBN 9781605581934. S2CID 7781746 .

Languages

In other projects