Apache Lucene - Apache Lucene
Utvikler (er) | Apache Software Foundation |
---|---|
Første utgivelse | 1999 |
Stabil utgivelse | 8.10.1 / 18. oktober 2021
|
Oppbevaringssted | |
Skrevet inn | Java |
Operativsystem | Kryssplattform |
Type | Søk og indekser |
Tillatelse | Apache lisens 2.0 |
Nettsted | lucene |
Apache Lucene er en fri og åpen kildekode søkemotor programvare bibliotek , opprinnelig skrevet på Java av Doug Cutting . Den støttes av Apache Software Foundation og er utgitt under Apache Software License . Lucene er mye brukt som et standardgrunnlag for søknader som ikke er forskning.
Lucene har blitt portet til andre programmeringsspråk, inkludert Object Pascal , Perl , C# , C ++ , Python , Ruby og PHP .
Historie
Doug Cutting skrev opprinnelig Lucene i 1999. Lucene var hans femte søkemotor, etter å ha skrevet to tidligere på Xerox PARC, en hos Apple, og en fjerde hos Excite. Den var opprinnelig tilgjengelig for nedlasting fra hjemmet på SourceForge -nettstedet . Det sluttet seg til Apache Software Foundation's Jakarta- familie med Java-produkter med åpen kildekode i september 2001 og ble sitt eget Apache-prosjekt på toppnivå i februar 2005. Navnet Lucene er Doug Cutting's kones mellomnavn og hennes mors bestemors fornavn.
Lucene tidligere inkluderte en rekke delprosjekter som Lucene.NET, Mahout , Tika og Nutch . Disse tre er nå uavhengige prosjekter på toppnivå.
I mars 2010 ble Apache Solr- søketjeneren med som et Lucene-delprosjekt, som fusjonerte utviklermiljøene.
Versjon 4.0 ble utgitt 12. oktober 2012.
I mars 2021 endret Lucene sin logo, og Apache Solr ble et Apache -prosjekt på toppnivå igjen, uavhengig av Lucene.
Funksjoner og vanlig bruk
Mens egnet for alle programmer som krever fulltekst indeksering og søking evne, er Lucene anerkjent for sin nytte i gjennomføringen av søkemotorer på Internett og lokalt, single-site søk.
Lucene inkluderer en funksjon for å utføre et uklart søk basert på redigeringsavstand .
Lucene har også blitt brukt til å implementere anbefalingssystemer. For eksempel kan Lucenes klasse 'MoreLikeThis' generere anbefalinger for lignende dokumenter. I en sammenligning av begrepet vektorbasert likhetstilnærming til 'MoreLikeThis' med siteringsbaserte dokumentlikhetstiltak, for eksempel ko-sitat og co-sitat-nærhetsanalyse, utmerket Lucens tilnærming seg ved å anbefale dokumenter med svært like strukturelle egenskaper og smalere beslektethet . Derimot pleide siteringsbaserte dokumentlikhetstiltak å være mer egnet for å anbefale mer bredt beslektede dokumenter, noe som betyr at siteringsbaserte tilnærminger kan være mer egnet for å generere serendipitøse anbefalinger, så lenge dokumenter som anbefales å inneholde sitater i teksten.
Lucene-baserte prosjekter
Lucene i seg selv er bare et indekserings- og søkebibliotek og inneholder ikke gjennomsøkings- og HTML -analysefunksjonalitet . Imidlertid utvider flere prosjekter Lucenes evne:
- Apache Nutch - gir webgjennomgang og HTML -analyse
- Apache Solr - en enterprise search server
- Kompass - forgjengeren til Elasticsearch
- CrateDB - åpen kildekode, distribuert SQL -database bygget på Lucene
- DocFetcher - et søkeapplikasjon for flere skrivebord
- Elasticsearch - en enterprise search server utgitt i 2010
- Kinosearch - en søkemotor skrevet i Perl og C og en løs havn i Lucene. Den Socialtext wiki-programvaren bruker denne søkemotoren, og det gjør MojoMojo wiki. Den brukes også av Human Metabolome Database (HMDB) og Toxin and Toxin-Target Database (T3DB).
- MongoDB Atlas Search-en sky-native enterprise search-applikasjon basert på MongoDB og Apache Lucene
- OpenSearch - en åpen kildekode for bedriftssøk -server basert på en gaffel av Elasticsearch 7
- Swiftype - en oppstart for bedriftssøk basert på Lucene
Se også
- Enterprise søk
- Informasjon utvinning
- Liste over bibliotek for henting av informasjon
- Tekstgruvedrift
Referanser
Bibliografi
- Gospodnetic, Otis; Erik Hatcher; Michael McCandless (28. juni 2009). Lucene in Action (2. utg.). Manning Publications . ISBN 978-1-9339-8817-7.
- Gospodnetic, Otis; Erik Hatcher (1. desember 2004). Lucene in Action (1. utg.). Manning Publications . ISBN 978-1-9323-9428-3.