automatic-speech-recognition

Sleeping

App Files Files Community

jguerrisi commited on Jul 29

Commit

2d65472

verified ·

1 Parent(s): a298116

Update model.py

Browse files

Files changed (1) hide show

model.py +15 -36

model.py CHANGED Viewed

@@ -1378,25 +1378,7 @@ def _get_sherpa_onnx_nemo_transducer_models(
     return recognizer
-@lru_cache(maxsize=10)
-def _get_nemo_ctc_models(repo_id: str, decoding_method: str, num_active_paths: int):
-    nn_model = _get_nn_model_filename(
-        repo_id=repo_id,
-        filename="model.int8.onnx",
-        subfolder=".",
-    )
-    tokens = _get_token_filename(
-        repo_id=repo_id,
-        filename="tokens.txt",
-        subfolder=".",
-    )
-    recognizer = sherpa_onnx.OfflineRecognizer.from_nemo_ctc(
-        tokens=tokens,
-        model=nn_model,
-        num_threads=2,
-        language="es",  # Force Spanish
-    )
-    return recognizer
 @lru_cache(maxsize=10)
 def _get_sherpa_onnx_nemo_ctc_models(
@@ -1410,29 +1392,27 @@ def _get_sherpa_onnx_nemo_ctc_models(
         "csukuangfj/sherpa-onnx-nemo-stt_pt_fastconformer_hybrid_large_pc-int8",
         "csukuangfj/sherpa-onnx-nemo-stt_de_fastconformer_hybrid_large_pc",
         "csukuangfj/sherpa-onnx-nemo-stt_de_fastconformer_hybrid_large_pc-int8",
     ], repo_id
-    if "int8" in repo_id:
-        model = _get_nn_model_filename(
-            repo_id=repo_id,
-            filename="model.int8.onnx",
-            subfolder=".",
-        )
-    else:
-        model = _get_nn_model_filename(
-            repo_id=repo_id,
-            filename="model.onnx",
-            subfolder=".",
-        )
-    tokens = _get_token_filename(repo_id=repo_id, subfolder=".")
     recognizer = sherpa_onnx.OfflineRecognizer.from_nemo_ctc(
         tokens=tokens,
         model=model,
         num_threads=2,
-        sample_rate=16000,
-        feature_dim=80,
     )
     return recognizer
@@ -2089,8 +2069,7 @@ multi_lingual_models = {
     "csukuangfj/sherpa-onnx-dolphin-small-ctc-multi-lang-int8-2025-04-02": _get_dolphin_ctc_models,
     "csukuangfj/sherpa-onnx-dolphin-base-ctc-multi-lang-2025-04-02": _get_dolphin_ctc_models,
     "csukuangfj/sherpa-onnx-dolphin-small-ctc-multi-lang-2025-04-02": _get_dolphin_ctc_models,
-    "csukuangfj/sherpa-onnx-nemo-canary-180m-flash-en-es-de-fr-int8": _get_dolphin_ctc_models,
-    "csukuangfj/sherpa-onnx-nemo-canary-180m-flash-en-es-de-fr-int8": _get_nemo_ctc_models,
 }
 chinese_english_mixed_models = {

     return recognizer
 @lru_cache(maxsize=10)
 def _get_sherpa_onnx_nemo_ctc_models(
         "csukuangfj/sherpa-onnx-nemo-stt_pt_fastconformer_hybrid_large_pc-int8",
         "csukuangfj/sherpa-onnx-nemo-stt_de_fastconformer_hybrid_large_pc",
         "csukuangfj/sherpa-onnx-nemo-stt_de_fastconformer_hybrid_large_pc-int8",
+        "csukuangfj/sherpa-onnx-nemo-canary-180m-flash-en-es-de-fr-int8",
     ], repo_id
+    filename = "model.int8.onnx" if "int8" in repo_id else "model.onnx"
+    model = _get_nn_model_filename(
+        repo_id=repo_id,
+        filename=filename,
+        subfolder=".",
+    )
+    tokens = _get_token_filename(
+        repo_id=repo_id,
+        filename="tokens.txt",
+        subfolder=".",
+    )
     recognizer = sherpa_onnx.OfflineRecognizer.from_nemo_ctc(
         tokens=tokens,
         model=model,
         num_threads=2,
     )
     return recognizer
     "csukuangfj/sherpa-onnx-dolphin-small-ctc-multi-lang-int8-2025-04-02": _get_dolphin_ctc_models,
     "csukuangfj/sherpa-onnx-dolphin-base-ctc-multi-lang-2025-04-02": _get_dolphin_ctc_models,
     "csukuangfj/sherpa-onnx-dolphin-small-ctc-multi-lang-2025-04-02": _get_dolphin_ctc_models,
+    "csukuangfj/sherpa-onnx-nemo-canary-180m-flash-en-es-de-fr-int8": _get_sherpa_onnx_nemo_ctc_models,
 }
 chinese_english_mixed_models = {