Spaces:
Running
Running
20240121 Güncellemesi
config
eis_share
eklendi. Colab gibi senaryolarda, WebUI'yi halka açık ağa yönlendirmek için bu değeriTrue
olarak ayarlayabilirsiniz.- WebUI'ye İngilizce sistem çeviri desteği eklendi.
cmd-asr
, FunASR modelinin dahil olup olmadığını otomatik olarak tespit eder; eğer varsayılan dizinde bulunamazsa, ModelScope'dan indirilecektir.- Issue 79de bildirilen SoVITS eğitimindeki ZeroDivisionError'u sıfır uzunlukta örnekleri filtreleyerek düzeltmeye çalıştık.
TEMP
klasöründeki önbelleğe alınmış ses dosyaları ve diğer dosyaları temizledik.- Referans sesinin sonunu içeren sentezlenmiş ses sorununu önemli ölçüde azalttık.
20240122 Güncellemesi
- Aşırı kısa çıktı dosyalarının referans sesini tekrarlamasına neden olan sorun giderildi.
- İngilizce ve Japonca eğitim için yerel destek test edildi (Japonca eğitim için kök dizinin İngilizce olmayan özel karakterlerden arındırılmış olması gerekir).
- Ses yolu denetimi iyileştirildi. Yanlış bir giriş yolundan okumaya çalışıldığında, ffmpeg hatası yerine yolun mevcut olmadığını bildirir.
20240123 Güncellemesi
- Hubert çıkarımının NaN hatalarına neden olup SoVITS/GPT eğitiminde ZeroDivisionError'a yol açtığı sorun çözüldü.
- İnferans WebUI'de hızlı model değiştirme desteği eklendi.
- Model dosyası sıralama mantığı optimize edildi.
- Çince kelime ayrımı için
jieba
jieba_fast
ile değiştirildi.
20240126 Güncellemesi
- Çince-İngilizce ve Japonca-İngilizce karışık çıktı metinleri için destek eklendi.
- Çıktı için isteğe bağlı bir bölme modu eklendi.
- UVR5'in dizinlerden otomatik olarak çıkmasına neden olan okuma sorununu düzelttik.
- Çeşitli yeni satır sorunlarını düzelterek çıkarım hatalarını giderdik.
- Çıkarım WebUI'deki gereksiz günlükleri kaldırdık.
- Mac'te eğitim ve çıkarım desteği eklendi.
- Yarım hassasiyeti desteklemeyen GPU'lar için otomatik olarak tek hassasiyet zorlandı; CPU çıkarımında tek hassasiyet uygulandı.
20240128 Güncellemesi
- Sayıların Çince karakterlere dönüştürülmesiyle ilgili sorunu düzelttik.
- Cümlelerin başındaki birkaç karakterin yutulması sorununu düzelttik.
- Mantıksız referans ses uzunluklarını sınırlamalar koyarak hariç tuttuk.
- GPT eğitiminin kontrol noktalarını kaydetmemesi sorununu düzelttik.
- Dockerfile'da model indirme sürecini tamamladık.
20240129 Güncellemesi
- Yarım hassasiyet eğitimi ile ilgili sorun yaşayan 16 serisi gibi GPU'lar için eğitim yapılandırmalarını tek hassasiyete değiştirdik.
- Mevcut Colab sürümünü test ettik ve güncelledik.
- Eski sürüm FunASR ile ModelScope FunASR deposunun git klonlanmasıyla oluşan arayüz hizalama hatalarını düzelttik.
20240130 Güncellemesi
- Çift tırnaklarla yol kopyalama hatalarını önlemek için tüm yol ile ilgili girdilerden otomatik olarak çift tırnakları kaldırdık.
- Çince ve İngilizce noktalama işaretlerini ayırma sorunlarını düzelttik ve cümlelerin başına ve sonuna noktalama işaretleri ekledik.
- Noktalama işaretlerine göre ayırma özelliğini ekledik.
20240201 Güncellemesi
- Ayrılma hatalarına neden olan UVR5 format okuma hatasını düzelttik.
- Karışık Çince-Japonca-İngilizce metinler için otomatik segmentasyon ve dil tanıma desteği sağladık.
20240202 Güncellemesi
/
ile biten bir ASR yolunun dosya adını kaydetme hatasına neden olma sorununu düzelttik.- PR 377 PaddleSpeech'in Normalizer'ını tanıtarak "xx.xx%" (yüzde sembolleri) ve "元/吨" ifadesinin "元吨" yerine "元每吨" olarak okunması gibi sorunları düzelttik ve alt çizgi hatalarını giderdik.
20240207 Güncellemesi
- Issue 391de bildirilen dil parametresi karışıklığının Çinçe çıkarım kalitesini düşürme sorununu düzelttik.
- PR 403 ile UVR5'i daha yüksek versiyonlarda librosa'ya uyarladık.
- Commit 14a2851
is_half
parametresinin booleana dönüştürülmemesi nedeniyle sürekli yarım hassasiyet çıkarımı yaparak 16 serisi GPU'lardainf
hatasına neden olan UVR5 inf hatasını düzelttik. - İngilizce metin önyüzünü optimize ettik.
- Gradio bağımlılıklarını düzelttik.
- Veri seti hazırlığı sırasında kök dizini boş bırakıldığında
.list
tam yollarının otomatik olarak okunmasını destekledik. - Japonca ve İngilizce için Faster Whisper ASR'yi entegre ettik.
20240208 Güncellemesi
- Commit 59f35ad ile Windows 10 1909'da ve Issue 232de (Geleneksel Çince Sistem Dili) bildirilen GPT eğitim durma sorununu düzeltmeye çalıştık.
20240212 Güncellemesi
- Faster Whisper ve FunASR için mantığı optimize ettik, Hugging Face bağlantı sorunlarını önlemek için Faster Whisper'ı ayna indirmelere yönlendirdik.
- PR 457 GPT tekrarı ve eksik karakterleri azaltmak için eğitim sırasında negatif örnekler oluşturarak deneysel DPO Loss eğitim seçeneğini etkinleştirdi ve çıkarım WebUI'de çeşitli çıkarım parametrelerini kullanılabilir hale getirdi.
20240214 Güncellemesi
- Eğitimde Çince deney adlarını destekledik (önceden hatalara neden oluyordu).
- DPO eğitimini zorunlu yerine isteğe bağlı bir özellik yaptık. Seçilirse, parti boyutu otomatik olarak yarıya indirilir. Çıkarım WebUI'de yeni parametrelerin iletilmemesi sorunlarını düzelttik.
20240216 Güncellemesi
- Referans metin olmadan girişi destekledik.
- Issue 475 de bildirilen Çince önyüz hatalarını düzelttik.
20240221 Güncellemesi
- Veri işleme sırasında bir gürültü azaltma seçeneği ekledik (gürültü azaltma sadece 16kHz örnekleme hızını bırakır; yalnızca arka plan gürültüsü önemliyse kullanın).
- PR 559, PR 556, PR 532, PR 507, PR 509 ile Çince ve Japonca önyüz işlemesini optimize ettik.
- Mac CPU çıkarımını daha hızlı performans için MPS yerine CPU kullanacak şekilde değiştirdik.
- Colab genel URL sorununu düzelttik.
20240306 Güncellemesi
- PR 672 çıkarımı %50 hızlandırdı (RTX3090 + PyTorch 2.2.1 + CU11.8 + Win10 + Py39 üzerinde test edildi).
- Faster Whisper'ın Çince olmayan ASR'sini kullanırken artık önce Çin FunASR modelini indirmeyi gerektirmiyor.
- PR 610 UVR5 yankı giderme modelindeki ayarın tersine çevrildiği sorunu düzeltti.
- PR 675 CUDA mevcut olmadığında Faster Whisper için otomatik CPU çıkarımını etkinleştirdi.
- PR 573 Mac'te doğru CPU çıkarımı sağlamak için
is_half
kontrolünü değiştirdi.
202403/202404/202405 Güncellemeleri
Küçük Düzeltmeler:
- Referans metin olmayan mod ile ilgili sorunlar düzeltildi.
- Çince ve İngilizce metin önyüzü optimize edildi.
- API formatı iyileştirildi.
- CMD format sorunları düzeltildi.
- Eğitim verisi işleme sırasında desteklenmeyen diller için hata uyarıları eklendi.
- Hubert çıkarımındaki hata düzeltildi.
Büyük Düzeltmeler:
- VQ'yu dondurmadan yapılan SoVITS eğitimi sorunu (bu kalite düşüşüne neden olabilir) düzeltildi.
- Hızlı çıkarım dalı eklendi.
20240610 Güncellemesi
Küçük Düzeltmeler:
- PR 1168 & PR 1169 saf noktalama işareti ve çoklu noktalama işareti metin girdisi için mantığı geliştirdi.
- Commit 501a74a UVR5'teki MDXNet yankı giderme için CMD formatını düzeltti, boşluk içeren yolları destekledi.
- PR 1159
s2_train.py
içindeki SoVITS eğitimi için ilerleme çubuğu mantığını düzeltti.
Büyük Düzeltmeler:
- Commit 99f09c8 WebUI'nin GPT ince ayarının, Çince giriş metinlerinin BERT özelliğini okumaması sorununu düzeltti, bu da çıkarım ile tutarsızlığa ve potansiyel kalite düşüşüne neden oluyordu. Dikkat: Daha önce büyük miktarda veri ile ince ayar yaptıysanız, modelin kalitesini artırmak için yeniden ayar yapmanız önerilir.
20240706 Güncellemesi
Küçük Düzeltmeler:
- Commit 1250670 CPU çıkarımında varsayılan yığın boyutu ondalık sorununu düzeltti.
- PR 1258, PR 1265, PR 1267 gürültü giderme veya ASR ile ilgili istisnalarla karşılaşıldığında bekleyen tüm ses dosyalarının çıkış yapmasına neden olan sorunları düzeltti.
- PR 1253 noktalama işaretlerine göre ayrılırken ondalıkların bölünmesi sorununu düzeltti.
- Commit a208698 çoklu GPU eğitimi için çoklu işlem kaydetme mantığını düzeltti.
- PR 1251 gereksiz
my_utils
'ı kaldırdı.
Büyük Düzeltmeler:
- PR 672 hızlandırılmış çıkarım kodu doğrulandı ve ana dala birleştirildi, taban ile tutarlı çıkarım etkileri sağlandı. Ayrıca referans metni olmayan modda hızlandırılmış çıkarımı destekler.
Gelecek güncellemeler, fast_inference
dalındaki değişikliklerin tutarlılığını doğrulamaya devam edecek.
20240727 Güncellemesi
Küçük Düzeltmeler:
- PR 1298 gereksiz i18n kodlarını temizledi.
- PR 1299 kullanıcı dosya yollarındaki sonlandırma eğik çizgilerinin komut satırı hatalarına neden olduğu sorunları düzeltti.
- PR 756 GPT eğitimindeki adım hesaplama mantığını düzeltti.
Büyük Düzeltmeler:
- Commit 9588a3c sentez için konuşma hızı ayarlamasını destekledi. Konuşma hızını ayarlarken rastgeleliği dondurmayı etkinleştirdi.
20240806 Güncellemesi
- PR 1306, PR 1356 BS RoFormer vokal eşlik ayırma modelini desteklemeye başladı. Commit e62e965 FP16 çıkarımı etkinleştirdi.
- Çince metin ön yüzünü geliştirdi.
- PR 1355 WebUI'de ses işlenirken yolları otomatik olarak doldurdu.
- Commit bce451a, Commit 4c8b761 GPU tanıma mantığını optimize etti.
- Commit 8a10147 Kantonca ASR desteği ekledi.
- GPT-SoVITS v2 desteği eklendi.
- PR 1387 zamanlama mantığını optimize etti.