Değişimli Oto-Kodlayıcılar kullanarak Diyalog Geliştirme
dc.authorid | Serap Kırbız / 0000-0001-7718-3683 | en_US |
dc.contributor.author | Kırbız, Serap | |
dc.date.accessioned | 2025-06-16T09:58:57Z | |
dc.date.available | 2025-06-16T09:58:57Z | |
dc.date.issued | 2025 | |
dc.department | Mühendislik Fakültesi, Elektrik Elektronik Mühendisliği Bölümü | en_US |
dc.description.PublishedMonth | Ocak | en_US |
dc.description.abstract | Bu makalede, kaynak ayrıştırma algoritmalarından faydalanarak birden fazla kaynaktan oluşan ses kayıtlarında konuşma işaretlerini güçlendirmek amacıyla bir yöntem sunulmaktadır. Konuşma sesleri ve diğer sesler arasındaki doğru dengeyi sağlamak, dinleyici şikayetleri arasında sıkça dile getirilen önemli bir sorun olarak öne çıkmaktadır. Bu çalışmada, diyalog içeren ses kayıtlarından diyalogların ayrıştırılmasında negatif olmayan gürültü giderici oto kodlayıcı modelleri kullanılmakta ve bu diyaloglar, diğer seslerle farklı oranlarda yeniden birleştirerek, kullanıcı tercihlerine uygun bir dinleme deneyimi sunulmaktadır. Önerilen yöntem, akan veri üzerinde çalışabilme özelliğine sahip olup, televizyon programları gibi gerçek zamanlı uygulamalara da uyarlanabilmektedir. | en_US |
dc.description.abstract | The paper proposes a method to enhance speech signals in audio recordings consisting of multiple sources by using source separation algorithms. Achieving the right balance between seç sounds and other sounds is a frequently mentioned issue among listener complaints. In this study, non-negative denoising variational autoencoder models are used to separate dialogues from audio recordings containing dialogues, and these dialogues are remixed with other sounds at different rates to provide a listening experience that suits the user's preferences. The proposed method has the ability to work on streaming data and can also be adapted to real-time applications such as television programs. | en_US |
dc.identifier.citation | Kırbız, S. (2025). Değişimli Oto-Kodlayıcılar kullanarak Diyalog Geliştirme. EMO Bilimsel Dergi, 15(1), 87-95. | en_US |
dc.identifier.endpage | 98 | en_US |
dc.identifier.issue | 1 | en_US |
dc.identifier.startpage | 87 | en_US |
dc.identifier.uri | https://hdl.handle.net/20.500.11779/2599 | |
dc.identifier.volume | 15 | en_US |
dc.institutionauthor | Kırbız, Serap | en_US |
dc.language.iso | tr | en_US |
dc.publisher | Dergi Park | en_US |
dc.relation.ispartof | EMO Bilimsel Dergi | en_US |
dc.relation.publicationcategory | Makale - Ulusal Hakemli Dergi - Kurum Öğretim Elemanı | en_US |
dc.rights | info:eu-repo/semantics/openAccess | en_US |
dc.subject | Kaynak ayrıştırma | en_US |
dc.subject | Diyalog geliştirme | en_US |
dc.subject | Derin Öğrenme | en_US |
dc.subject | Source separation | en_US |
dc.subject | Dialogue enhancement | en_US |
dc.subject | Deep learning | en_US |
dc.title | Değişimli Oto-Kodlayıcılar kullanarak Diyalog Geliştirme | en_US |
dc.title.alternative | Dialogue Enhancement using Variational Autoencoders | en_US |
dc.type | Article | en_US |
Files
Original bundle
1 - 1 of 1
No Thumbnail Available
- Name:
- Değişimli Oto Kodlayıcı.pdf
- Size:
- 638.37 KB
- Format:
- Adobe Portable Document Format
- Description:
License bundle
1 - 1 of 1
No Thumbnail Available
- Name:
- license.txt
- Size:
- 3.2 KB
- Format:
- Item-specific license agreed upon to submission
- Description: