Semantisk web - Semantic Web

The Semantic Web (allment kjent som Web 3.0 ) er en forlengelse av World Wide Web gjennom standarder satt av World Wide Web Consortium (W3C). Målet med Semantic Web er å gjøre Internett- data maskinlesbare.

For å muliggjøre koding av semantikk med dataene, brukes teknologier som Resource Description Framework (RDF) og Web Ontology Language (OWL). Disse teknologiene brukes til å formelt representere metadata . For eksempel kan ontologi beskrive begreper , forhold mellom enheter og kategorier av ting. Disse innebygde semantikkene gir betydelige fordeler som resonnement fremfor data og drift med heterogene datakilder.

Disse standardene fremmer vanlige dataformater og utveksler protokoller på nettet, i utgangspunktet RDF. I følge W3C gir "The Semantic Web et felles rammeverk som gjør at data kan deles og gjenbrukes på tvers av applikasjons-, bedrifts- og fellesskapsgrenser." Det semantiske nettet blir derfor sett på som en integrator på tvers av forskjellige innholds- og informasjonsapplikasjoner og -systemer.

Begrepet ble laget av Tim Berners-Lee for et web med data (eller data-web ) som kan behandles av maskiner-det vil si en der mye av betydningen er maskinlesbar . Selv om kritikerne har satt spørsmålstegn ved gjennomførbarheten, hevder talsmenn at applikasjoner innen bibliotek- og informasjonsvitenskap , industri, biologi og humanvitenskapelig forskning allerede har bevist gyldigheten av det opprinnelige konseptet.

Berners-Lee uttrykte opprinnelig sin visjon om det semantiske nettet i 1999 som følger:

Jeg har en drøm for nettet [der datamaskiner] blir i stand til å analysere alle dataene på nettet - innholdet, lenker og transaksjoner mellom mennesker og datamaskiner. Et "semantisk web", som gjør dette mulig, har ennå ikke dukket opp, men når det gjør det, vil de daglige mekanismene for handel, byråkrati og vårt daglige liv bli håndtert av maskiner som snakker med maskiner. De " intelligente agenter " som folk har spådd i evigheter, vil endelig materialisere seg.

Scientific American- artikkelen fra 2001 av Berners-Lee, Hendler og Lassila beskrev en forventet utvikling av det eksisterende nettet til et semantisk web. I 2006 uttalte Berners-Lee og kolleger at: "Denne enkle ideen ... forblir stort sett urealisert". I 2013 inneholdt mer enn fire millioner webdomener (av omtrent 250 millioner totalt) Semantic Web -oppslag.

Eksempel

I det følgende eksemplet vil teksten "Paul Schuster ble født i Dresden" på et nettsted bli kommentert, og koble en person til fødestedet hans. Følgende HTML -fragment viser hvordan en liten graf blir beskrevet i RDFa -syntaks ved bruk av et ordforråd schema.org og en Wikidata ID:

<div vocab="https://schema.org/" typeof="Person">
  <span property="name">Paul Schuster</span> was born in
  <span property="birthPlace" typeof="Place" href="https://www.wikidata.org/entity/Q1731">
    <span property="name">Dresden</span>.
  </span>
</div>
Graf som er resultatet av RDFa -eksemplet

Eksemplet definerer følgende fem tripler (vist i syntaks for skilpadder ). Hver trippel representerer en kant i den resulterende grafen: det første elementet i trippelen ( emnet ) er navnet på noden der kanten starter, det andre elementet ( predikatet ) typen av kanten, og det siste og tredje elementet ( objektet ) enten navnet på noden der kanten ender eller en bokstavelig verdi (f.eks. en tekst, et tall, etc.).

Triplene resulterer i grafen vist i den gitte figuren .

Graf som kommer fra RDFa -eksemplet, beriket med ytterligere data fra nettet

En av fordelene med å bruke Uniform Resource Identifiers (URI) er at de kan skilles ut ved hjelp av HTTP -protokollen. I henhold til de såkalte Linked Open Data- prinsippene, bør en slik utsatt URI resultere i et dokument som gir ytterligere data om den gitte URI. I dette eksemplet kan alle URIer, både for kanter og noder (f.eks http://schema.org/Person. http://schema.org/birthPlace, http://www.wikidata.org/entity/Q1731) Skilles ut og vil resultere i ytterligere RDF -grafer, som beskriver URI, f.eks. At Dresden er en by i Tyskland, eller at en person, i betydningen at URI, kan være fiktiv.

Den andre grafen viser det forrige eksemplet, men er nå beriket med noen av tripplene fra dokumentene som er resultatet av dereferencing https://schema.org/Person(grønn kant) og https://www.wikidata.org/entity/Q1731(blå kanter).

I tillegg til kantene angitt i de involverte dokumentene eksplisitt, kan kanter automatisk utledes: trippel

fra det originale RDFa -fragmentet og trippelen

fra dokumentet på https://schema.org/Person(grønn kant i figuren) tillate å utlede følgende trippel, gitt OWL -semantikk (rød stiplet linje i den andre figuren):

Bakgrunn

Konseptet med den semantiske nettverksmodellen ble dannet på begynnelsen av 1960 -tallet av forskere som den kognitive forskeren Allan M. Collins , lingvist M. Ross Quillian og psykolog Elizabeth F. Loftus som en form for å representere semantisk strukturert kunnskap. Når den brukes i sammenheng med det moderne internett, utvider den nettverket av hyperkoblede lesbare nettsider ved å sette inn maskinlesbare metadata om sider og hvordan de er relatert til hverandre. Dette gjør at automatiserte agenter får tilgang til Internett mer intelligent og utfører flere oppgaver på vegne av brukerne. Begrepet "Semantic Web" ble laget av Tim Berners-Lee , oppfinneren av World Wide Web og direktør for World Wide Web Consortium (" W3C "), som fører tilsyn med utviklingen av foreslåtte semantiske webstandarder. Han definerer Semantic Web som "et web av data som kan behandles direkte og indirekte av maskiner".

Mange av teknologiene foreslått av W3C eksisterte allerede før de ble plassert under W3C -paraplyen. Disse brukes i forskjellige sammenhenger, spesielt de som omhandler informasjon som omfatter et begrenset og definert domene, og hvor deling av data er en vanlig nødvendighet, for eksempel vitenskapelig forskning eller datautveksling mellom virksomheter. I tillegg har andre teknologier med lignende mål dukket opp, for eksempel mikroformater .

Begrensninger for HTML

Mange filer på en typisk datamaskin kan også løst deles inn i lesbare dokumenter og maskinlesbare data. Dokumenter som postmeldinger, rapporter og brosjyrer leses av mennesker. Data, for eksempel kalendere, adressebøker, spillelister og regneark, presenteres ved hjelp av et applikasjonsprogram som lar dem vises, søkes og kombineres.

Foreløpig er World Wide Web hovedsakelig basert på dokumenter skrevet i Hypertext Markup Language (HTML), en markup -konvensjon som brukes til å kode en tekstdel ispedd multimediaobjekter som bilder og interaktive skjemaer. Metadatakoder gir en metode der datamaskiner kan kategorisere innholdet på nettsider. I eksemplene nedenfor er feltnavnene "søkeord", "beskrivelse" og "forfatter" tilordnet verdier som "databehandling" og "billige widgets for salg" og "John Doe".

<meta name="keywords" content="computing, computer studies, computer" />
<meta name="description" content="Cheap widgets for sale" />
<meta name="author" content="John Doe" />

På grunn av denne metadatamerkingen og kategoriseringen kan andre datasystemer som ønsker å få tilgang til og dele disse dataene enkelt identifisere de relevante verdiene.

Med HTML og et verktøy for å gjengi det (kanskje nettleserprogramvare , kanskje en annen brukeragent ), kan man opprette og presentere en side som viser varer til salgs. HTML-koden på denne katalogsiden kan komme med enkle påstander på dokumentnivå, for eksempel "dette dokumentets tittel er" Widget Superstore " ", men det er ingen evne i HTML-koden selv til å påstå utvetydig at for eksempel varenummer X586172 er en Acme Gizmo med en utsalgspris på € 199, eller at det er et forbrukerprodukt. HTML kan heller bare si at spennet i teksten "X586172" er noe som bør plasseres nær "Acme Gizmo" og "€ 199", etc. Det er ingen måte å si "dette er en katalog" eller til og med å fastslå at "Acme Gizmo" er en slags tittel eller at "€ 199" er en pris. Det er heller ingen måte å uttrykke at disse opplysningene er bundet sammen for å beskrive et diskret element, forskjellig fra andre elementer som kanskje er oppført på siden.

Semantisk HTML refererer til den tradisjonelle HTML -øvelsen med markup etter intensjon, i stedet for å spesifisere layoutdetaljer direkte. For eksempel bruk av å <em>betegne "vekt" i stedet for <i>, som spesifiserer kursiv . Layoutdetaljer overlates til nettleseren, i kombinasjon med Cascading Style Sheets . Men denne praksisen mangler å spesifisere semantikken til objekter som varer til salgs eller priser.

Mikroformater utvider HTML-syntaksen for å lage maskinlesbar semantisk markering om objekter, inkludert mennesker, organisasjoner, hendelser og produkter. Lignende tiltak inkluderer RDFa , Microdata og Schema.org .

Semantiske webløsninger

The Semantic Web tar løsningen videre. Det innebærer publisering på språk som er spesielt designet for data: Ressursbeskrivelsesramme (RDF), Web Ontology Language (OWL) og Extensible Markup Language ( XML ). HTML beskriver dokumenter og koblingene mellom dem. RDF, OWL og XML kan derimot beskrive vilkårlige ting som mennesker, møter eller flydeler.

Disse teknologiene kombineres for å gi beskrivelser som utfyller eller erstatter innholdet i webdokumenter. Dermed kan innhold manifestere seg som beskrivende data lagret i webtilgjengelige databaser , eller som markering i dokumenter (spesielt i Extensible HTML ( XHTML ) ispedd XML, eller, oftere, rent i XML, med layout eller gjengivelse av signaler lagret separat ). De maskinlesbare beskrivelsene gjør at innholdsforvaltere kan tilføre innholdet mening, dvs. å beskrive strukturen i kunnskapen vi har om det innholdet. På denne måten kan en maskin behandle kunnskap selv, i stedet for tekst, ved å bruke prosesser som ligner menneskelig deduktiv resonnement og slutning , og derved oppnå mer meningsfulle resultater og hjelpe datamaskiner med å utføre automatisert informasjonsinnhenting og forskning.

Et eksempel på en tag som vil bli brukt på en ikke-semantisk webside:

<item>blog</item>

Koding av lignende informasjon på en semantisk webside kan se slik ut:

<item rdf:about="https://example.org/semantic-web/">Semantic Web</item>

Tim Berners-Lee kaller det resulterende nettverket av koblede data for den gigantiske globale grafen , i motsetning til det HTML-baserte World Wide Web. Berners-Lee hevder at hvis fortiden var deling av dokumenter, er fremtiden datadeling . Hans svar på spørsmålet om "hvordan" gir tre instruksjonspunkter. En, en URL skal peke på dataene. To, alle som får tilgang til nettadressen, skal få data tilbake. Tre, relasjoner i dataene bør peke på flere nettadresser med data.

Web 3.0

Semantisk web

Tim Berners-Lee har beskrevet det semantiske nettet som en komponent i Web 3.0.

Folk spør stadig hva Web 3.0 er. Jeg tror at når du har et overlegg av skalerbar vektorgrafikk - alt som risler og bretter og ser tåkete ut - på Web 2.0 og tilgang til et semantisk web integrert på tvers av et stort dataområde, har du tilgang til en utrolig dataressurs …

-  Tim Berners-Lee, 2006

"Semantisk web" brukes noen ganger som et synonym for "Web 3.0", selv om definisjonen av hvert begrep varierer.

Desentralisering

Web 3.0 har begynt å dukke opp som en bevegelse bort fra sentralisering av tjenester som søk, sosiale medier og chat-applikasjoner som er avhengige av at en enkelt organisasjon skal fungere, og beskrives som "den neste, etter Big Tech- fasen".

Guardian -journalist John Harris vurderte Web 3.0 -konseptet gunstig i begynnelsen av 2019, og spesielt arbeidet fra Berners -Lee med et desentraliseringsprosjekt kalt Solid , basert på personlige datalagre eller "pods", som enkeltpersoner beholder kontroll over. Berners -Lee har dannet en oppstart, Inrupt, for å fremme ideen og tiltrekke seg frivillige utviklere.

Utfordringer

Noen av utfordringene for det semantiske nettet inkluderer storhet, uklarhet, usikkerhet, inkonsekvens og bedrag. Automatiserte resonnementsystemer må håndtere alle disse problemene for å oppfylle løftet fra det semantiske nettet.

  • Vastness: World Wide Web inneholder mange milliarder sider. Den SNOMED CT medisinsk terminologi ontologi alene inneholder 370.000 klasse navn, og eksisterende teknologi har ennå ikke vært i stand til å eliminere alle semantisk dupliseres vilkår. Ethvert automatisert resonnementssystem må håndtere virkelig store innganger.
  • Uklarhet: Dette er upresise begreper som "ung" eller "høy". Dette stammer fra uklarheten i brukerforespørsler, konsepter representert av innholdsleverandører, matchende søkeord til leverandørbetingelser og forsøk på å kombinere forskjellige kunnskapsbaser med overlappende, men subtilt forskjellige begreper. Uklar logikk er den vanligste teknikken for å håndtere uklarhet.
  • Usikkerhet: Dette er presise begreper med usikre verdier. For eksempel kan en pasient presentere et sett med symptomer som tilsvarer en rekke forskjellige diagnoser med hver sin sannsynlighet. Probabilistiske resonnementsteknikker brukes vanligvis for å håndtere usikkerhet.
  • Inkonsekvens: Dette er logiske motsetninger som uunngåelig vil oppstå under utviklingen av store ontologier, og når ontologier fra separate kilder kombineres. Deduktive resonnementer mislykkes katastrofalt når de står overfor inkonsekvens, fordi "alt følger av en motsetning" . Ubegrenselig resonnement og parakonsistent resonnement er to teknikker som kan brukes for å håndtere inkonsekvens.
  • Bedrag: Dette er når produsenten av informasjonen bevisst villeder forbrukeren av informasjonen. Kryptografiteknikker brukes for tiden for å dempe denne trusselen. Ved å gi et middel for å bestemme informasjonens integritet, inkludert det som er knyttet til identiteten til enheten som produserte eller publiserte informasjonen, må troverdighetsproblemer imidlertid fortsatt tas opp i tilfeller av potensiell bedrag.

Denne listen over utfordringer er illustrerende snarere enn uttømmende, og den fokuserer på utfordringene til de "samlende logikk" og "bevis" -lagene i det semantiske nettet. World Wide Web Consortium (W3C) Incubator Group for Usikkerhetsresonnement for World Wide Web (URW3-XG) sluttrapport klumper disse problemene sammen under den ene overskriften "usikkerhet". Mange av teknikkene nevnt her vil kreve utvidelser av Web Ontology Language (OWL) for eksempel for å kommentere betingede sannsynligheter. Dette er et område med aktiv forskning.

Standarder

Standardisering for Semantic Web i sammenheng med Web 3.0 er under omsorg av W3C.

Komponenter

Begrepet "semantisk web" brukes ofte mer spesifikt for å referere til formater og teknologier som gjør det mulig. Innsamling, strukturering og gjenoppretting av koblede data er muliggjort av teknologier som gir en formell beskrivelse av begreper, begreper og relasjoner innenfor et gitt kunnskapsdomene . Disse teknologiene er spesifisert som W3C -standarder og inkluderer:

The Semantic Web Stack illustrerer arkitekturen til det semantiske nettet. Funksjonene og forholdene til komponentene kan oppsummeres som følger:

  • XML gir en elementær syntaks for innholdsstruktur i dokumenter, men knytter likevel ingen semantikk til betydningen av innholdet i. XML er for øyeblikket ikke en nødvendig komponent i Semantic Web -teknologier i de fleste tilfeller, da det finnes alternative syntakser, for eksempel Turtle . Turtle er en de facto standard, men har ikke vært gjennom en formell standardiseringsprosess.
  • XML Schema er et språk for å gi og begrense strukturen og innholdet i elementene i XML -dokumenter.
  • RDF er et enkelt språk for å uttrykke datamodeller , som refererer til objekter (" webressurser ") og deres relasjoner. En RDF-basert modell kan representeres i en rekke syntakser, f.eks. RDF/XML , N3, Turtle og RDFa. RDF er en grunnleggende standard for det semantiske nettet.
  • RDF Schema utvider RDF og er et ordforråd for å beskrive egenskaper og klasser av RDF-baserte ressurser, med semantikk for generaliserte hierarkier av slike egenskaper og klasser.
  • OWL legger til mer ordforråd for å beskrive egenskaper og klasser: blant annet relasjoner mellom klasser (f.eks. Usammenheng), kardinalitet (f.eks. "Nøyaktig en"), likestilling, rikere typing av egenskaper, egenskaper ved egenskaper (f.eks. Symmetri) og oppregnede klasser.
  • SPARQL er en protokoll og spørrespråk for semantiske webdatakilder.
  • RIF er W3C Rule Interchange Format. Det er et XML -språk for å uttrykke nettregler som datamaskiner kan kjøre. RIF tilbyr flere versjoner, kalt dialekter. Den inkluderer en RIF Basic Logic Dialect (RIF-BLD) og RIF Production Rules Dialect (RIF PRD).

Gjeldende standardiseringstilstand

Veletablerte standarder:

Er ennå ikke helt klar over:

applikasjoner

Hensikten er å forbedre brukervennligheten og nytten av Internett og dets sammenkoblede ressurser ved å lage semantiske webtjenester , for eksempel:

  • Servere som avslører eksisterende datasystemer ved bruk av RDF- og SPARQL -standarder. Mange omformere til RDF finnes fra forskjellige applikasjoner. Relasjonsdatabaser er en viktig kilde. Den semantiske webserveren kobles til det eksisterende systemet uten å påvirke driften.
  • Dokumenter "merket opp" med semantisk informasjon (en utvidelse av HTML <meta> -taggene som brukes på dagens nettsider for å levere informasjon for web -søkemotorer som bruker webcrawlere ). Dette kan være maskinforståelig informasjon om det menneskelig forståelige innholdet i dokumentet (for eksempel skaperen, tittelen, beskrivelsen, etc.) eller det kan være rent metadata som representerer et sett med fakta (for eksempel ressurser og tjenester andre steder på nettstedet ). Legg merke til at alt som kan identifiseres med en Uniform Resource Identifier (URI) kan beskrives, så det semantiske nettet kan resonnere om dyr, mennesker, steder, ideer, etc. Det er fire semantiske annotasjonsformater som kan brukes i HTML -dokumenter; Microformat, RDFa, Microdata og JSON-LD . Semantisk markering genereres ofte automatisk, i stedet for manuelt.
  • Vanlige metadataordforråd ( ontologier ) og kart mellom ordforråd som gjør at dokumentskapere kan vite hvordan de skal markere dokumentene sine, slik at agenter kan bruke informasjonen i de medleverte metadataene (slik at forfatteren i betydningen 'forfatteren av siden' vant ' t forveksles med Forfatter i betydningen en bok som er gjenstand for en bokanmeldelse).
  • Automatiserte agenter for å utføre oppgaver for brukere av det semantiske nettet ved hjelp av disse dataene.
  • Nettbaserte tjenester (ofte med egne agenter) for å levere informasjon spesifikt til agenter, for eksempel en Trust-tjeneste som en agent kan spørre om en nettbutikk har en historie med dårlig service eller spam .

Slike tjenester kan være nyttige for offentlige søkemotorer, eller kan brukes til kunnskapshåndtering i en organisasjon. Forretningsapplikasjoner inkluderer:

  • Tilrettelegging for integrering av informasjon fra blandede kilder
  • Oppløse uklarheter i bedriftsterminologi
  • Forbedring av informasjonsinnhenting og derved reduserer informasjonsoverbelastning og øker forfining og presisjon av dataene som hentes
  • Identifisere relevant informasjon med hensyn til et gitt domene
  • Gi støtte til beslutninger

I et selskap er det en lukket gruppe brukere, og ledelsen er i stand til å håndheve selskapets retningslinjer som vedtakelse av spesifikke ontologier og bruk av semantisk kommentar . Sammenlignet med det offentlige Semantic Web er det mindre krav til skalerbarhet, og informasjonen som sirkulerer i et selskap kan generelt sett være mer klarert; personvern er mindre et problem utenfor håndtering av kundedata.

Skeptiske reaksjoner

Praktisk gjennomførbarhet

Kritikere setter spørsmålstegn ved den grunnleggende gjennomførbarheten av en fullstendig eller til og med delvis oppfyllelse av det semantiske nettet, og påpeker både vanskeligheter med å sette det opp og mangel på generell brukbarhet som forhindrer at den nødvendige innsatsen investeres. I en artikkel fra 2003 påpeker Marshall og Shipman den kognitive overhead som ligger i formalisering av kunnskap, sammenlignet med forfatteren av tradisjonell webhypertekst :

Selv om det er relativt enkelt å lære det grunnleggende i HTML, krever det å lære et språk eller verktøy for kunnskapsrepresentasjon at forfatteren lærer om representasjonens metoder for abstraksjon og deres effekt på resonnement. For eksempel er det å forstå klasse-forekomstforholdet, eller forholdet mellom superklasse og underklasse, mer enn å forstå at ett konsept er en "type" et annet konsept. […] Disse abstraksjonene blir lært av informatikere generelt og kunnskapsingeniører spesielt, men de stemmer ikke overens med den lignende naturlige språkbetydningen å være en "type" noe. Effektiv bruk av en slik formell representasjon krever at forfatteren blir en dyktig kunnskapsingeniør i tillegg til alle andre ferdigheter som domenet krever. […] Når man har lært et formelt representasjonsspråk, er det fortsatt ofte mye større innsats for å uttrykke ideer i den representasjonen enn i en mindre formell representasjon […]. Dette er faktisk en form for programmering basert på deklarasjon av semantiske data og krever forståelse for hvordan resonneringsalgoritmer vil tolke de forfattede strukturene.

I følge Marshall og Shipman øker den stiltiende og endrede naturen til mye kunnskap det kunnskapstekniske problemet og begrenser det semantiske webens anvendelighet for spesifikke domener. Et annet problem de påpeker, er domen- eller organisasjonsspesifikke måter å uttrykke kunnskap på, som må løses gjennom samfunnsavtale i stedet for bare tekniske midler. Som det viser seg, har spesialiserte lokalsamfunn og organisasjoner for prosjekter innenfor selskapet hatt en tendens til å ta i bruk semantiske webteknologier som er større enn perifere og mindre spesialiserte lokalsamfunn. De praktiske begrensningene mot adopsjon har virket mindre utfordrende der domenet og omfanget er mer begrenset enn det for allmennheten og World-Wide Web.

Til slutt ser Marshall og Shipman pragmatiske problemer i ideen om ( Knowledge Navigator -stil) intelligente agenter som jobber i det stort sett manuelt kuraterte Semantic Web:

I situasjoner der brukerbehov er kjent og distribuerte informasjonsressurser er godt beskrevet, kan denne tilnærmingen være svært effektiv; i situasjoner som ikke er forutsett og som samler et uventet utvalg av informasjonsressurser, er Googles tilnærming mer robust. Videre er det semantiske nettet avhengig av slutningskjeder som er mer sprø; et manglende element i kjeden resulterer i en unnlatelse av å utføre ønsket handling, mens mennesket kan levere manglende brikker i en mer Google-lignende tilnærming. [...] fordeler mellom fordeler og fordeler kan virke til fordel for spesialopprettede semantiske webmetadata rettet mot å veve sammen fornuftige, godt strukturerte domenespesifikke informasjonsressurser; nøye oppmerksomhet til bruker/kundebehov vil drive disse føderasjonene hvis de skal lykkes.

Cory Doctorows kritikk (" metakrap ") er sett fra menneskelig oppførsel og personlige preferanser. For eksempel kan folk inkludere falske metadata på websider i et forsøk på å villede semantiske webmotorer som naivt antar metadataens sannhet. Dette fenomenet var godt kjent med metatagger som lurte Altavista -rangeringsalgoritmen til å heve rangeringen av visse websider: Google -indekseringsmotoren ser spesielt etter slike forsøk på manipulasjon. Peter Gärdenfors og Timo Honkela påpeker at logikkbaserte semantiske webteknologier dekker bare en brøkdel av de relevante fenomenene knyttet til semantikk.

Sensur og personvern

Entusiasme for det semantiske nettet kan dempes av bekymringer angående sensur og personvern . For eksempel kan tekstanalyseteknikker nå lett omgås ved å bruke andre ord, for eksempel metaforer, eller ved å bruke bilder i stedet for ord. En avansert implementering av det semantiske nettet ville gjøre det mye lettere for regjeringer å kontrollere visning og opprettelse av elektronisk informasjon, ettersom denne informasjonen ville være mye lettere for en automatisk innholdsblokkerende maskin å forstå. I tillegg har spørsmålet også vært reist om at, med bruk av foaf filer og geolocation meta-data , vil det være svært lite anonymitet i forbindelse med forfatterskapet av artikler om ting som en personlig blogg. Noen av disse bekymringene ble adressert i "Policy Aware Web" -prosjektet og er et aktivt tema for forskning og utvikling.

Dobling av utdataformater

En annen kritikk av det semantiske nettet er at det ville være mye mer tidkrevende å lage og publisere innhold fordi det må være to formater for ett stykke data: ett for menneskelig visning og ett for maskiner. Imidlertid løser mange webapplikasjoner under utvikling dette problemet ved å lage et maskinlesbart format ved publisering av data eller forespørsel fra en maskin for slike data. Utviklingen av mikroformater har vært en reaksjon på denne typen kritikk. Et annet argument for å forsvare muligheten for semantisk web er den sannsynlige fallende prisen på menneskelig intelligens oppgaver i digitale arbeidsmarkeder, som for eksempel Amazon 's Mechanical Turk .

Spesifikasjoner som eRDF og RDFa gjør at vilkårlige RDF -data kan legges inn i HTML -sider. De GRDDL (Gleaning Resource beskrivelser fra dialekter av Language) som mekanismen kan foreliggende materiale (inkludert mikro) for automatisk tolket som RDF, slik at utgivere behøver bare å bruke en enkelt format, slik som HTML.

Forskningsaktiviteter om bedriftsapplikasjoner

Den første forskergruppen som eksplisitt fokuserte på Corporate Semantic Web, var ACACIA-teamet ved INRIA-Sophia-Antipolis , grunnlagt i 2002. Resultatene av deres arbeid inkluderer den RDF (S) -baserte Corese-søkemotoren og anvendelsen av semantisk webteknologi i område av distribuert kunstig intelligens for kunnskapshåndtering (f.eks. ontologier og multi-agent-systemer for bedriftens semantiske web) og E-læring .

Siden 2008 har forskningsgruppen Corporate Semantic Web, som ligger ved Free University of Berlin , fokusert på byggesteiner: Corporate Semantic Search, Corporate Semantic Collaboration og Corporate Ontology Engineering.

Ontologisk ingeniørforskning inkluderer spørsmålet om hvordan man kan involvere ikke-ekspertbrukere i å lage ontologier og semantisk kommentert innhold og for å trekke ut eksplisitt kunnskap fra interaksjonen mellom brukere i bedrifter.

Fremtiden for søknader

Tim O'Reilly , som skapte begrepet Web 2.0, foreslo en langsiktig visjon om det semantiske nettet som et nett av data, der sofistikerte applikasjoner manipulerer datanettet. Datanettet forvandler World Wide Web fra et distribuert filsystem til et distribuert databasesystem.

Se også

Referanser

Videre lesning

Eksterne linker