Upload README.md

82922c2 verified about 1 year ago

517 Bytes

language: mn
license: mit
tags:
  - mongolian
  - tokenizer
  - sentencepiece

SentencePiece Tokenizer

This repository contains a fine-tuned SentencePiece tokenizer on Mongolian text.

Files

from transformers import AutoTokenizer

tokenizer = AutoTokenizer.from_pretrained("Namuun123/mn_sentencepiece_tokenizer")