Infoboks - Infobox

En ekte infoboks fra British Rail Class 43- bil 43185 som drives av First Great Western

wiki er en infoboks en tabell som brukes til å samle og presentere et delsett med informasjon om emnet, for eksempel et dokument . Det er et strukturert dokument som inneholder et sett med attributt -verdipar , og representerer i Wikipedia en oppsummering av informasjon om emnet for en artikkel . På denne måten er de sammenlignbare med datatabeller i noen aspekter. Når den presenteres i det større dokumentet, oppsummeres den, en infoboks presenteres ofte i et sidefeltformat .

En infoboks kan implementeres i et annet dokument ved å transskludere den til det dokumentet og spesifisere noen eller alle attributt -verdi -parene som er knyttet til infoboksen, kjent som parameterisering .

Wikipedia

En infoboks kan brukes til å oppsummere informasjonen i en artikkel på Wikipedia . De brukes på lignende artikler for å sikre konsistens i presentasjonen ved å bruke et vanlig format. Opprinnelig ble infobokser (og maler generelt) brukt til sideoppsett . En infoboks kan transskluderes til en artikkel ved å spesifisere verdien for noen eller alle dens parametere . Parameternavnet som brukes må være det samme som det som er angitt i infoboksmalen, men en hvilken som helst verdi kan være knyttet til det. Navnet er avgrenset fra verdien med et likhetstegn . Parameternavnet kan betraktes som et attributt for artikkelen.

{{Infobox prepared food
| name             =
| image            =
| imagesize        =
| caption          =
| alternate_name   =
| country          =
| region           =
| creator          =
| course           =
| type             =
| served           =
| main_ingredient  =
| variations       =
| calories         =
| other            =
}}
{{Infobox prepared food
| name             = Crostata
| image            = Crostata limone e zenzero 3.jpg
| imagesize        =
| caption          = Crostata with lemon ginger filling
| alternate_name   = 
| country          = [[Italy]]
| region           = [[Lombardia]]
| creator          = 
| course           = [[Dessert]]
| type             = [[Tart]]
| served           = 
| main_ingredient  = Pastry crust, [[jam]] or [[ricotta]], fruit
| variations       = ''Crostata di frutta'', ''crostata di ricotta'', many other sweet or savoury variations
| calories         = 
| other            = 
}}
Infoboksen info tilberedt mat brukes på Wikipedia mat-relaterte artikler, med ingen verdier som er angitt for de parametere (attributter). Den samme infoboksen som implementert i artikkelen crostata . Vær oppmerksom på at verdier er til høyre for likhetstegnet (=), og at parameternavnene er de samme som i spesifikasjonen for infoboksmalen. Verdiene er i wiki -oppsett : oppføringer som er lagt inn i firkantede parenteser (f.eks. [[Tart]]) blir gjengitt som en lenke til den respektive Wikipedia -artikkelen (f.eks. Tart ), og den koblede filen vil bli transkludert i artikkelen i stedet for markup.
Infoboksen for Wikipedia -artikkelen Crostata gjengitt av en nettlesermotor på en stasjonær datamaskin
Taxoboksen (forkortelse for taksonomi -infoboks) for Wikipedia -artikkelen Xuanhanosaurus gjengitt av en nettlesermotor (på Safari ) på en stasjonær datamaskin ( iMac ). En taxoboks er en type infoboks som beskriver taksonomien til en bestemt livsform eller et dyr

På Wikipedia blir en infoboks omsluttet til en artikkel ved å omslutte navn og attributt -verdi -par i et dobbelt sett med seler . Den Mediawiki -programvaren som Wikipedia opererer deretter analyserer dokumentet, som infoboksen og andre maler behandles av en mal prosessor . Dette er en malmotor som produserer et webdokument og et stilark som brukes til presentasjon av dokumentet. Dette gjør at utformingen av infoboksen kan skilles fra innholdet den manipulerer; det vil si at utformingen av malen kan oppdateres uten å påvirke informasjonen i den, og det nye designet vil automatisk spre seg til alle artikler som transskluderer infoboksen. Vanligvis er infobokser formatert til å vises øverst til høyre i en Wikipedia-artikkel i skrivebordsvisningen, eller øverst i mobilvisningen.

Plassering av en infoboks i wikitext av en artikkel er viktig for tilgjengelighet . En beste praksis er å plassere dem etter disambigueringsmaler (de som henviser lesere til artikler om emner med lignende navn) og vedlikeholdsmaler (for eksempel det som markerer en artikkel som referanseløs), men før alt annet innhold .

Baeza-Yates og King sier at noen redaktører synes maler som infobokser er kompliserte, ettersom malen kan skjule tekst om en eiendom eller ressurs som redaktøren ønsker å endre; dette forverres av lenkete maler, det vil si maler transskludert i andre maler.

Fra august 2009 brukte engelsk Wikipedia omtrent 3000 infoboksmaler som samlet brukte mer enn 20 000 attributter. Siden den gang har mange blitt slått sammen for å redusere redundans. Per juni 2013 var det minst 1,345,446 ingar i morselskapet Infoboksmal , som brukes av noen, men ikke alle, annonse, på 4,251,127 artikler.

Navnet på en infoboks er vanligvis "Infobox [sjanger]"; Imidlertid kan mye brukte infobokser tildeles kortere navn, for eksempel "taxobox" for taksonomi.

Maskinlæring

Omtrent 44,2% av Wikipedia-artiklene inneholdt en infoboks i 2008, og omtrent 33% i 2010. Automatisert semantisk kunnskapsuttrekking ved hjelp av maskinlæringsalgoritmer brukes til å "trekke ut maskinbehandlingsbar informasjon til en relativt lav kompleksitetskostnad". Den lave dekningen gjør det imidlertid vanskeligere, selv om dette delvis kan overvinnes ved å komplettere artikkeldata med de i kategorier der artikkelen er inkludert. Den franske Wikipedia startet prosjektet Infobox versjon 2 i mai 2011.

Kunnskap innhentet ved maskinlæring kan brukes til å forbedre en artikkel, for eksempel ved å bruke automatiserte programvareforslag til redaktører for å legge til infoboksdata. IPopulator -prosjektet opprettet et system for å tilføre en verdi til en artikkels infobox -parameter via en automatisk analyse av teksten til den artikkelen.

DBpedia bruker strukturert innhold hentet fra infobokser med maskinlæringsalgoritmer for å lage en ressurs med koblede data i det semantiske nettet ; det har blitt beskrevet av Tim Berners-Lee som "en av de mer kjente" komponentene i det koblede dataprosjektet.

Maskinekstraksjon skaper en trippel bestående av et emne, predikat eller relasjon og objekt. Hvert attributt-verdi-par i infoboksen brukes til å lage en RDF- setning ved hjelp av en ontologi . Dette blir lettere av det smalere gapet mellom Wikipedia og en ontologi enn det som eksisterer mellom ustrukturert eller fri tekst og en ontologi.

Det semantiske forholdet mellom subjekt og objekt blir etablert av predikatet. I eksempelboksen angir trippelen ("crostata", type, "terte") at en crostata er en type terte . Artikkelens emne brukes som emne, parameternavnet brukes som predikat, og parameterens verdi som objekt. Hver type infoboks tilordnes en ontologiklasse, og hver egenskap (parameter) i en infoboks tilordnes en ontologi -egenskap. Disse tilordningene brukes når du analyserer en Wikipedia -artikkel for å trekke ut data.

Sitater

Generelle referanser

Videre lesning