Spaces:

bigscience-data
/

scisearch

Paused

App Files Files Community

ola13 commited on Feb 22, 2023

Commit

a113452

•

1 Parent(s): 1f58c5b

error handling

Browse files

Files changed (1) hide show

app.py +34 -17

app.py CHANGED Viewed

@@ -71,6 +71,10 @@ def process_pii(text):
     return text
 def format_result(result, highlight_terms, exact_search, datasets_filter=None):
     text, url, docid = result
     if datasets_filter is not None:
@@ -114,17 +118,17 @@ def format_result(result, highlight_terms, exact_search, datasets_filter=None):
         else ""
     )
     docid_html = get_docid_html(docid)
-    language = "FIXME"
     result_html = """{}
-        <span style='font-size:14px; font-family: Arial; color:#7978FF; text-align: left;'>Document ID: {}</span>
         <a href="https://forms.gle/AdBLLwRApqcLkHYA8" target="_blank">
             <button style="color:#ffcdf8; ">🏴‍☠️ Flag result 🏴‍☠️</button>
         </a><br>
-        <!--  <span style='font-size:12px; font-family: Arial; color:MediumAquaMarine'>Language: {}</span><br> -->
         <span style='font-family: Arial;'>{}</span><br>
         <br>
     """.format(
-        url_html, docid_html, language, tokens_html
     )
     return "<p>" + result_html + "</p>"
@@ -144,6 +148,7 @@ def format_result_page(
     result_page_html = ""
     for lang, results_for_lang in results.items():
         if len(results_for_lang) == 0:
             if exact_search:
                 result_page_html += """<div style='font-family: Arial; color:Silver; text-align: left; line-height: 3em'>
@@ -177,17 +182,16 @@ def format_result_page(
             Total number of matches: <b style='color:MediumAquaMarine'>{}</b></div>""".format(
             num_results
         )
     return header_html + result_page_html
 def extract_results_from_payload(query, language, payload, exact_search):
     results = payload["results"]
     processed_results = dict()
     datasets = set()
     highlight_terms = None
     num_results = None
     if exact_search:
         highlight_terms = query
         num_results = payload["num_results"]
@@ -214,7 +218,14 @@ def extract_results_from_payload(query, language, payload, exact_search):
     return processed_results, highlight_terms, num_results, list(datasets)
-def process_error(error_type):
     if error_type == "unsupported_lang":
         detected_lang = payload["err"]["meta"]["detected_lang"]
         return f"""
@@ -333,12 +344,12 @@ if __name__ == "__main__":
             else:
                 query = " ".join(query.split())
             if query == "" or query is None:
-                return None
             payload = request_payload(query, lang, exact_search, k, received_results)
             err = extract_error_from_payload(payload)
             if err is not None:
-                return process_error(err)
             (
                 processed_results,
@@ -351,7 +362,7 @@ if __name__ == "__main__":
                 payload,
                 exact_search,
             )
-            result_page_html = format_result_page(
                 lang, processed_results, highlight_terms, num_results, exact_search
             )
             return (
@@ -359,20 +370,23 @@ if __name__ == "__main__":
                 highlight_terms,
                 num_results,
                 exact_search,
-                result_page_html,
                 ds,
             )
         def submit(query, lang, k, dropdown_input):
             print("submitting", query, lang, k)
             (
                 processed_results,
                 highlight_terms,
                 num_results,
                 exact_search,
-                result_page_html,
                 datasets,
-            ) = run_query(query, lang, k, dropdown_input, 0)
             has_more_results = exact_search and (num_results > k)
             return [
                 processed_results,
@@ -383,7 +397,7 @@ if __name__ == "__main__":
                 gr.Dropdown.update(choices=datasets, value=datasets),
                 gr.update(visible=has_more_results),
                 len(next(iter(processed_results.values()))),
-                result_page_html,
             ]
         def next_page(
@@ -394,14 +408,17 @@ if __name__ == "__main__":
             received_results,
             processed_results,
         ):
             (
                 processed_results,
                 highlight_terms,
                 num_results,
                 exact_search,
-                result_page_html,
                 datasets,
-            ) = run_query(query, lang, k, dropdown_input, received_results)
             current_results = sum(
                 len(results) for results in processed_results.values()
             )
@@ -420,7 +437,7 @@ if __name__ == "__main__":
                 gr.Dropdown.update(choices=datasets, value=datasets),
                 gr.update(visible=current_results >= k and has_more_results),
                 received_results + current_results,
-                result_page_html,
             ]
         def filter_datasets(

     return text
+def extract_lang_from_docid(docid):
+    return docid.split("_")[1]
 def format_result(result, highlight_terms, exact_search, datasets_filter=None):
     text, url, docid = result
     if datasets_filter is not None:
         else ""
     )
     docid_html = get_docid_html(docid)
+    language = extract_lang_from_docid(docid)
     result_html = """{}
+        <span style='font-size:14px; font-family: Arial; color:MediumAquaMarine'>Language: {} | </span>
+        <span style='font-size:14px; font-family: Arial; color:#7978FF; text-align: left;'>Document ID: {} | </span>
         <a href="https://forms.gle/AdBLLwRApqcLkHYA8" target="_blank">
             <button style="color:#ffcdf8; ">🏴‍☠️ Flag result 🏴‍☠️</button>
         </a><br>
         <span style='font-family: Arial;'>{}</span><br>
         <br>
     """.format(
+        url_html, language, docid_html, tokens_html
     )
     return "<p>" + result_html + "</p>"
     result_page_html = ""
     for lang, results_for_lang in results.items():
+        print("Processing language", lang)
         if len(results_for_lang) == 0:
             if exact_search:
                 result_page_html += """<div style='font-family: Arial; color:Silver; text-align: left; line-height: 3em'>
             Total number of matches: <b style='color:MediumAquaMarine'>{}</b></div>""".format(
             num_results
         )
     return header_html + result_page_html
 def extract_results_from_payload(query, language, payload, exact_search):
     results = payload["results"]
     processed_results = dict()
     datasets = set()
     highlight_terms = None
     num_results = None
     if exact_search:
         highlight_terms = query
         num_results = payload["num_results"]
     return processed_results, highlight_terms, num_results, list(datasets)
+def no_query_error_message():
+    return f"""
+        <p style='font-size:18px; font-family: Arial; color:MediumVioletRed; text-align: center;'>
+        Please provide a non-empty query.
+        </p><br><hr><br>"""
+def process_error(error_type, payload):
     if error_type == "unsupported_lang":
         detected_lang = payload["err"]["meta"]["detected_lang"]
         return f"""
             else:
                 query = " ".join(query.split())
             if query == "" or query is None:
+                return no_query_error_message()
             payload = request_payload(query, lang, exact_search, k, received_results)
             err = extract_error_from_payload(payload)
             if err is not None:
+                return process_error(err, payload)
             (
                 processed_results,
                 payload,
                 exact_search,
             )
+            result_page = format_result_page(
                 lang, processed_results, highlight_terms, num_results, exact_search
             )
             return (
                 highlight_terms,
                 num_results,
                 exact_search,
+                result_page,
                 ds,
             )
         def submit(query, lang, k, dropdown_input):
             print("submitting", query, lang, k)
+            response = run_query(query, lang, k, dropdown_input, 0)
+            if not isinstance(response, tuple):
+                return {result_page_html: response}
             (
                 processed_results,
                 highlight_terms,
                 num_results,
                 exact_search,
+                result_page,
                 datasets,
+            ) = response
             has_more_results = exact_search and (num_results > k)
             return [
                 processed_results,
                 gr.Dropdown.update(choices=datasets, value=datasets),
                 gr.update(visible=has_more_results),
                 len(next(iter(processed_results.values()))),
+                result_page,
             ]
         def next_page(
             received_results,
             processed_results,
         ):
+            response = run_query(query, lang, k, dropdown_input, received_results)
+            if not isinstance(response, tuple):
+                return {result_page_html: response}
             (
                 processed_results,
                 highlight_terms,
                 num_results,
                 exact_search,
+                result_page,
                 datasets,
+            ) = response
             current_results = sum(
                 len(results) for results in processed_results.values()
             )
                 gr.Dropdown.update(choices=datasets, value=datasets),
                 gr.update(visible=current_results >= k and has_more_results),
                 received_results + current_results,
+                result_page,
             ]
         def filter_datasets(