Apache Lucene - Apache Lucene

Lucene
Apache Lucene logo.svg
Utvikler (er) Apache Software Foundation
Første utgivelse 1999 ; 22 år siden ( 1999 )
Stabil utgivelse
8.10.1 / 18. oktober 2021 ; 0 dager siden ( 2021-10-18 )
Oppbevaringssted
Skrevet inn Java
Operativsystem Kryssplattform
Type Søk og indekser
Tillatelse Apache lisens 2.0
Nettsted lucene .apache .org

Apache Lucene er en fri og åpen kildekode søkemotor programvare bibliotek , opprinnelig skrevet på Java av Doug Cutting . Den støttes av Apache Software Foundation og er utgitt under Apache Software License . Lucene er mye brukt som et standardgrunnlag for søknader som ikke er forskning.

Lucene har blitt portet til andre programmeringsspråk, inkludert Object Pascal , Perl , C# , C ++ , Python , Ruby og PHP .

Historie

Doug Cutting skrev opprinnelig Lucene i 1999. Lucene var hans femte søkemotor, etter å ha skrevet to tidligere på Xerox PARC, en hos Apple, og en fjerde hos Excite. Den var opprinnelig tilgjengelig for nedlasting fra hjemmet på SourceForge -nettstedet . Det sluttet seg til Apache Software Foundation's Jakarta- familie med Java-produkter med åpen kildekode i september 2001 og ble sitt eget Apache-prosjekt på toppnivå i februar 2005. Navnet Lucene er Doug Cutting's kones mellomnavn og hennes mors bestemors fornavn.

Lucene tidligere inkluderte en rekke delprosjekter som Lucene.NET, Mahout , Tika og Nutch . Disse tre er nå uavhengige prosjekter på toppnivå.

I mars 2010 ble Apache Solr- søketjeneren med som et Lucene-delprosjekt, som fusjonerte utviklermiljøene.

Versjon 4.0 ble utgitt 12. oktober 2012.

I mars 2021 endret Lucene sin logo, og Apache Solr ble et Apache -prosjekt på toppnivå igjen, uavhengig av Lucene.

Funksjoner og vanlig bruk

Mens egnet for alle programmer som krever fulltekst indeksering og søking evne, er Lucene anerkjent for sin nytte i gjennomføringen av søkemotorer på Internett og lokalt, single-site søk.

Lucene inkluderer en funksjon for å utføre et uklart søk basert på redigeringsavstand .

Lucene har også blitt brukt til å implementere anbefalingssystemer. For eksempel kan Lucenes klasse 'MoreLikeThis' generere anbefalinger for lignende dokumenter. I en sammenligning av begrepet vektorbasert likhetstilnærming til 'MoreLikeThis' med siteringsbaserte dokumentlikhetstiltak, for eksempel ko-sitat og co-sitat-nærhetsanalyse, utmerket Lucens tilnærming seg ved å anbefale dokumenter med svært like strukturelle egenskaper og smalere beslektethet . Derimot pleide siteringsbaserte dokumentlikhetstiltak å være mer egnet for å anbefale mer bredt beslektede dokumenter, noe som betyr at siteringsbaserte tilnærminger kan være mer egnet for å generere serendipitøse anbefalinger, så lenge dokumenter som anbefales å inneholde sitater i teksten.

Lucene-baserte prosjekter

Lucene i seg selv er bare et indekserings- og søkebibliotek og inneholder ikke gjennomsøkings- og HTML -analysefunksjonalitet . Imidlertid utvider flere prosjekter Lucenes evne:

Se også

Referanser

Bibliografi

Eksterne linker