Adding searchers

6b7314e1 · mohamad.alturky · 214a7bb9 · 6b7314e1 · 6b7314e1 · 6b7314e1
Commit 6b7314e1 authored Mar 24, 2024 by mohamad.alturky
5 changed files
--- a/src/main/java/com/search/lucene/Lucene.java
+++ b/src/main/java/com/search/lucene/Lucene.java
@@ -4,7 +4,7 @@ import java.io.IOException;
 import com.search.lucene.file.filters.TextFileFilter;
 import com.search.lucene.indexers.TextFileIndexer;
-import com.search.lucene.searchers.Searcher;
+import com.search.lucene.searchers.TextFileSearcher;
 import com.search.lucene.settings.LuceneConstants;
 import org.apache.lucene.document.Document;
 import org.apache.lucene.queryparser.classic.ParseException;
@@ -16,7 +16,7 @@ public class Lucene {
    private static final String indexDir = "index";
    private static final String dataDir = "data";
    private static TextFileIndexer indexer;
-    private static Searcher searcher;
+    private static TextFileSearcher textFileSearcher;
    public static void main(String[] args) {
        try {
@@ -42,15 +42,15 @@ public class Lucene {
    }
    private static void search(String searchQuery) throws IOException, ParseException {
-        searcher = new Searcher(indexDir);
+        textFileSearcher = new TextFileSearcher(indexDir);
        long startTime = System.currentTimeMillis();
-        TopDocs hits = searcher.search(searchQuery);
+        TopDocs hits = textFileSearcher.search(searchQuery);
        long endTime = System.currentTimeMillis();
        System.out.println(hits.totalHits +
                " documents found. Time :" + (endTime - startTime));
        for(ScoreDoc scoreDoc : hits.scoreDocs) {
-            Document doc = searcher.getDocument(scoreDoc);
+            Document doc = textFileSearcher.getDocument(scoreDoc);
            System.out.println("File: "
                    + doc.get(LuceneConstants.FILE_PATH));
        }

--- a/src/main/java/com/search/lucene/searchers/Searcher.java
+++ b/src/main/java/com/search/lucene/searchers/Searcher.java
 package com.search.lucene.searchers;
-import java.io.IOException;
+import com.search.lucene.searchers.abstractions.ISearcher;
-import java.nio.file.Paths;
 import com.search.lucene.settings.LuceneConstants;
 import org.apache.lucene.analysis.standard.StandardAnalyzer;
 import org.apache.lucene.document.Document;
@@ -18,13 +16,16 @@ import org.apache.lucene.search.TopDocs;
 import org.apache.lucene.store.Directory;
 import org.apache.lucene.store.FSDirectory;
-public class Searcher {
+import java.io.IOException;
+import java.nio.file.Paths;
+public class CSVFileSearcher implements ISearcher {
    IndexSearcher indexSearcher;
    QueryParser queryParser;
    Query query;
-    public Searcher(String indexDirectoryPath)
+    public CSVFileSearcher(String indexDirectoryPath)
            throws IOException {
        Directory indexDirectory =
                FSDirectory.open(Paths.get(indexDirectoryPath));
@@ -34,12 +35,13 @@ public class Searcher {
                new StandardAnalyzer());
    }
+    @Override
    public TopDocs search( String searchQuery)
            throws IOException, ParseException {
        query = queryParser.parse(searchQuery);
        return indexSearcher.search(query, LuceneConstants.MAX_SEARCH);
    }
+    @Override
    public Document getDocument(ScoreDoc scoreDoc)
            throws CorruptIndexException, IOException {
        return indexSearcher.doc(scoreDoc.doc);

--- a/src/main/java/com/search/lucene/searchers/PDFFileSearcher.java
+++ b/src/main/java/com/search/lucene/searchers/PDFFileSearcher.java
+package com.search.lucene.searchers;
+import com.search.lucene.searchers.abstractions.ISearcher;
+import com.search.lucene.settings.LuceneConstants;
+import org.apache.lucene.analysis.standard.StandardAnalyzer;
+import org.apache.lucene.document.Document;
+import org.apache.lucene.index.CorruptIndexException;
+import org.apache.lucene.index.DirectoryReader;
+import org.apache.lucene.index.IndexReader;
+import org.apache.lucene.queryparser.classic.ParseException;
+import org.apache.lucene.queryparser.classic.QueryParser;
+import org.apache.lucene.search.IndexSearcher;
+import org.apache.lucene.search.Query;
+import org.apache.lucene.search.ScoreDoc;
+import org.apache.lucene.search.TopDocs;
+import org.apache.lucene.store.Directory;
+import org.apache.lucene.store.FSDirectory;
+import java.io.IOException;
+import java.nio.file.Paths;
+public class PDFFileSearcher implements ISearcher {
+    IndexSearcher indexSearcher;
+    QueryParser queryParser;
+    Query query;
+    public PDFFileSearcher(String indexDirectoryPath)
+            throws IOException {
+        Directory indexDirectory =
+                FSDirectory.open(Paths.get(indexDirectoryPath));
+        IndexReader reader = DirectoryReader.open(indexDirectory);
+        indexSearcher = new IndexSearcher(reader);
+        queryParser = new QueryParser(LuceneConstants.CONTENTS,
+                new StandardAnalyzer());
+    }
+    @Override
+    public TopDocs search( String searchQuery)
+            throws IOException, ParseException {
+        query = queryParser.parse(searchQuery);
+        return indexSearcher.search(query, LuceneConstants.MAX_SEARCH);
+    }
+    @Override
+    public Document getDocument(ScoreDoc scoreDoc)
+            throws CorruptIndexException, IOException {
+        return indexSearcher.doc(scoreDoc.doc);
+    }
+}
\ No newline at end of file
--- a/src/main/java/com/search/lucene/searchers/TextFileSearcher.java
+++ b/src/main/java/com/search/lucene/searchers/TextFileSearcher.java
+package com.search.lucene.searchers;
+import java.io.IOException;
+import java.nio.file.Paths;
+import com.search.lucene.searchers.abstractions.ISearcher;
+import com.search.lucene.settings.LuceneConstants;
+import org.apache.lucene.analysis.standard.StandardAnalyzer;
+import org.apache.lucene.document.Document;
+import org.apache.lucene.index.CorruptIndexException;
+import org.apache.lucene.index.DirectoryReader;
+import org.apache.lucene.index.IndexReader;
+import org.apache.lucene.queryparser.classic.ParseException;
+import org.apache.lucene.queryparser.classic.QueryParser;
+import org.apache.lucene.search.IndexSearcher;
+import org.apache.lucene.search.Query;
+import org.apache.lucene.search.ScoreDoc;
+import org.apache.lucene.search.TopDocs;
+import org.apache.lucene.store.Directory;
+import org.apache.lucene.store.FSDirectory;
+public class TextFileSearcher implements ISearcher {
+    IndexSearcher indexSearcher;
+    QueryParser queryParser;
+    Query query;
+    public TextFileSearcher(String indexDirectoryPath)
+            throws IOException {
+        Directory indexDirectory =
+                FSDirectory.open(Paths.get(indexDirectoryPath));
+        IndexReader reader = DirectoryReader.open(indexDirectory);
+        indexSearcher = new IndexSearcher(reader);
+        queryParser = new QueryParser(LuceneConstants.CONTENTS,
+                new StandardAnalyzer());
+    }
+    @Override
+    public TopDocs search( String searchQuery)
+            throws IOException, ParseException {
+        query = queryParser.parse(searchQuery);
+        return indexSearcher.search(query, LuceneConstants.MAX_SEARCH);
+    }
+    @Override
+    public Document getDocument(ScoreDoc scoreDoc)
+            throws CorruptIndexException, IOException {
+        return indexSearcher.doc(scoreDoc.doc);
+    }
+}
\ No newline at end of file
--- a/src/main/java/com/search/lucene/searchers/abstractions/ISearcher.java
+++ b/src/main/java/com/search/lucene/searchers/abstractions/ISearcher.java
+package com.search.lucene.searchers.abstractions;
+import org.apache.lucene.document.Document;
+import org.apache.lucene.index.CorruptIndexException;
+import org.apache.lucene.queryparser.classic.ParseException;
+import org.apache.lucene.search.ScoreDoc;
+import org.apache.lucene.search.TopDocs;
+import java.io.IOException;
+public interface ISearcher {
+     Document getDocument(ScoreDoc scoreDoc) throws CorruptIndexException, IOException;
+     TopDocs search(String searchQuery) throws IOException, ParseException;
+}