KoichiYasuoka
/

roberta-classical-chinese-base-sentence-segmentation

Token Classification

Literary Chinese

classical chinese

literary chinese

ancient chinese

sentence segmentation

Inference Endpoints

Model card Files Files and versions Community

KoichiYasuoka commited on Aug 31, 2021

Commit

03ea4bb

•

1 Parent(s): 65d08c9

example changed

Files changed (1) hide show

README.md +2 -2

README.md CHANGED Viewed

@@ -10,7 +10,7 @@ tags:
 license: "apache-2.0"
 pipeline_tag: "token-classification"
 widget:
-- text: "子曰學而時習之不亦說乎有朋自遠方來不亦樂乎人不知而不慍不亦君子乎"
 ---
 # roberta-classical-chinese-base-sentence-segmentation
@@ -26,7 +26,7 @@ import torch
 from transformers import AutoTokenizer,AutoModelForTokenClassification
 tokenizer=AutoTokenizer.from_pretrained("KoichiYasuoka/roberta-classical-chinese-base-sentence-segmentation")
 model=AutoModelForTokenClassification.from_pretrained("KoichiYasuoka/roberta-classical-chinese-base-sentence-segmentation")
-s="子曰學而時習之不亦說乎有朋自遠方來不亦樂乎人不知而不慍不亦君子乎"
 p=[model.config.id2label[q] for q in torch.argmax(model(tokenizer.encode(s,return_tensors="pt"))[0],dim=2)[0].tolist()[1:-1]]
 print("".join(c+"。" if q=="E" or q=="S" else c for c,q in zip(s,p)))
 ```

 license: "apache-2.0"
 pipeline_tag: "token-classification"
 widget:
+- text: "子曰學而時習之不亦説乎有朋自遠方來不亦樂乎人不知而不慍不亦君子乎"
 ---
 # roberta-classical-chinese-base-sentence-segmentation
 from transformers import AutoTokenizer,AutoModelForTokenClassification
 tokenizer=AutoTokenizer.from_pretrained("KoichiYasuoka/roberta-classical-chinese-base-sentence-segmentation")
 model=AutoModelForTokenClassification.from_pretrained("KoichiYasuoka/roberta-classical-chinese-base-sentence-segmentation")
+s="子曰學而時習之不亦説乎有朋自遠方來不亦樂乎人不知而不慍不亦君子乎"
 p=[model.config.id2label[q] for q in torch.argmax(model(tokenizer.encode(s,return_tensors="pt"))[0],dim=2)[0].tolist()[1:-1]]
 print("".join(c+"。" if q=="E" or q=="S" else c for c,q in zip(s,p)))
 ```