From 3f3177b5ce07593c70f7e0e35f084adaf161fc67 Mon Sep 17 00:00:00 2001
From: Ftps <ftpsflandre@gmail.com>
Date: Sun, 27 Aug 2023 19:14:01 +0900
Subject: [PATCH] load audio with gradio-file

---
 infer/lib/audio.py | 11 +++++++++--
 1 file changed, 9 insertions(+), 2 deletions(-)

diff --git a/infer/lib/audio.py b/infer/lib/audio.py
index 776939d..61db726 100644
--- a/infer/lib/audio.py
+++ b/infer/lib/audio.py
@@ -1,3 +1,4 @@
+import librosa
 import ffmpeg
 import numpy as np
 
@@ -15,7 +16,13 @@ def load_audio(file, sr):
             .output("-", format="f32le", acodec="pcm_f32le", ac=1, ar=sr)
             .run(cmd=["ffmpeg", "-nostdin"], capture_stdout=True, capture_stderr=True)
         )
+        return np.frombuffer(out, np.float32).flatten()
+
+    except AttributeError:
+        audio = file[1] / 32768.0
+        if len(audio.shape) == 2:
+            audio = np.mean(audio, -1)
+        return librosa.resample(audio, orig_sr=file[0], target_sr=16000)
+
     except Exception as e:
         raise RuntimeError(f"Failed to load audio: {e}")
-
-    return np.frombuffer(out, np.float32).flatten()