Spaces:

Omkar008
/

receipt_radar_test

Sleeping

Omkar008 commited on Feb 7

Commit

c0bad28

•

1 Parent(s): 3f50e38

Update get_gmail_data.py

Files changed (1) hide show

get_gmail_data.py CHANGED Viewed

@@ -151,17 +151,14 @@ class GmailDataExtractor:
             payload = message_data['payload']['headers']
             print("printing headers response")
             print(payload)
-            print()
-            print()
-            brand_from_gmail = ''
             company_from_gmail = ''
-            # if payload['headers']['name'] == 'from':
-            #     brand_from_gmail = payload['headers']['value']
-            #     company_from_gmail = extract_domain_from_email(brand_from_gmail)
-            # else:
-            #     company_from_gmail = None
             for part in parts:
                 if 'mimeType' not in part:
                     continue
@@ -218,7 +215,10 @@ class GmailDataExtractor:
         # Extract text
         text = soup.get_text(separator=' ')
         text = re.sub(r'\s+', ' ', text).strip()
         # Extract links
         links = [(link.text, link['href']) for link in soup.find_all('a', href=True)]

             payload = message_data['payload']['headers']
             print("printing headers response")
             print(payload)
             company_from_gmail = ''
+            #Extracting the domain name from the senders email
+            for fromdata in payload:
+                if fromdata['name'] == 'From':
+                    company_from_gmail = extract_domain_from_email(fromdata['value'])
+                    break
             for part in parts:
                 if 'mimeType' not in part:
                     continue
         # Extract text
         text = soup.get_text(separator=' ')
         text = re.sub(r'\s+', ' ', text).strip()
+        print("Printing the extracted text from the html")
+        print(text)
+        print()
+        print()
         # Extract links
         links = [(link.text, link['href']) for link in soup.find_all('a', href=True)]