Rabu, 18 September 2019




Ledakan popularitas podcasting telah memberikan suara baru kepada dunia konten kata yang diucapkan yang sebagian besar telah dibiarkan mati dengan penurunan siaran radio. Sekarang mengendarai gelombang pertumbuhan itu, sebuah startup bernama Descript yang membangun alat untuk membuat seni membuat podcast - atau konten lain yang melibatkan bekerja dengan audio - sedikit lebih mudah dengan transkripsi audio dan alat editing, memiliki trio pengumuman berita: pendanaan, akuisisi dan peluncuran alat baru yang membawa keajaiban pemrosesan bahasa alami dan AI ke media dengan membiarkan orang membuat audio dari suara mereka sendiri berdasarkan teks yang mereka ketik.



Descript, startup terbaru dari pendiri Groupon Andrew Mason, diciptakan sebagai spin-off dari bisnis panduan audio-nya, Detour (yang diakuisisi oleh Bose tahun lalu), hari ini mengumumkan pendanaan $ 15 juta, Seri A untuk memperluas bisnis ( termasuk merekrut lebih banyak orang) yang datang dari Andreessen Horowitz (juga mendanai putaran awal startup pada tahun 2017) dan Redpoint.



Bersamaan dengan itu, perusahaan telah mengakuisisi startup kecil Kanada, Lyrebird - yang, seperti Descript, juga membangun alat pengeditan audio. Bersama-sama, keduanya meluncurkan fitur baru untuk Descript yang disebut Overdub: orang sekarang akan dapat membuat "templat" dari suara mereka yang pada gilirannya dapat mereka gunakan untuk membuat audio berdasarkan kata-kata yang mereka ketik, bagian dari rangkaian produksi yang lebih besar itu juga akan memungkinkan pengguna mengedit banyak suara di banyak trek. Audio dapat berupa mandiri, atau trek audio untuk video.



(Transkripsi video bekerja sedikit berbeda: Ketika Anda menambahkan kata-kata, atau mengeluarkannya, video membuat lompatan untuk memperhitungkan perubahan waktu.)

Overdub adalah tambahan terbaru untuk produk yang memungkinkan pengguna membuat transkripsi teks audio instan yang kemudian dapat dipotong dan berpotensi ditambah dengan musik dari audio lain menggunakan alat seret-dan-jatuhkan yang menghilangkan kebutuhan podcaster untuk mempelajari teknik dan pengeditan suara perangkat lunak. Penekanan non-teknis dari produk ini telah memberi Descript pengikut di antara para podcast dan yang lainnya yang menggunakan perangkat lunak transkripsi sebagai bagian dari rangkaian produksi audio mereka. Produk ini diberi harga dalam format freemium: tidak ada biaya untuk konten suara hingga empat jam, dan $ 10 per bulan setelah itu.







Di zaman berita palsu yang menentukan pasar dan memenangkan pemilihan dibantu dan didukung oleh teknologi, Anda akan dimaafkan jika bertanya-tanya apakah Overdub mungkin bukan jalan raya menuju Deep Fake City, di mana Anda dapat menggunakan teknologi untuk menciptakan segala cara “ pernyataan ”oleh suara-suara terkenal.



Mason memberi tahu saya bahwa perusahaan telah membangun cara agar hal itu tidak terjadi.



Demo di halaman beranda perusahaan dibuat dengan suara eksklusif khusus hanya untuk tujuan ilustrasi, tetapi untuk benar-benar mengaktifkan fitur pengeditan dan penambahan untuk sepotong audio mereka sendiri, pengguna harus terlebih dahulu merekam sejumlah pernyataan yang diulang kembali, berdasarkan teks yang dibuat dengan cepat dan secara real time. Klip audio ini kemudian digunakan untuk membentuk profil suara digital Anda.



Ini berarti bahwa Anda tidak dapat, misalnya, memasukkan audio Donald Trump ke dalam sistem untuk membuat versi presiden yang mengatakan bahwa ia sangat menyesal telah menyarankan bahwa membangun tembok antara AS dan Meksiko adalah ide yang baik, dan bahwa ini pada kenyataannya, tidak akan membuat Amerika Hebat Lagi. (Sangat buruk.)



Tetapi jika Anda berlangganan gagasan bahwa kemajuan teknologi di NLP dan AI secara keseluruhan adalah sesuatu dari kotak Pandora, kucing sudah keluar dari kantong, dan bahkan jika Descript tidak mengizinkannya, orang lain kemungkinan akan meretas teknologi semacam ini untuk tujuan yang lebih jahat. Jawabannya, kata Mason, adalah terus membicarakan hal ini dan memastikan orang memahami potensi dan jebakan.



"Orang-orang sudah menciptakan kemampuan untuk membuat kesalahan besar," kata Mason. “Kita harus berharap bahwa tidak semua orang akan mengikuti kendala yang sama yang telah kita ikuti. Tetapi bagian dari peran kami adalah menciptakan kesadaran akan berbagai kemungkinan. Suara Anda adalah identitas Anda, dan Anda harus memiliki suara itu. Ini masalah privasi, pada dasarnya. "

Perkembangan menggarisbawahi peluang baru yang telah membuka dalam memanfaatkan beberapa perkembangan dalam kecerdasan buatan untuk mengatasi apa yang merupakan pasar yang sedang tumbuh. Di satu sisi, ini adalah pasar besar: Hanya berdasarkan pendapatan iklan saja, podcasting diperkirakan akan menghasilkan $ 679 juta tahun ini, dan $ 1 miliar pada tahun 2021, menurut IAB - salah satu alasan mengapa perusahaan seperti Spotify dan Apple bertaruh besar di atasnya sebagai pelengkap bisnis streaming musik mereka.



Di sisi lain, area alat produksi untuk podcasters adalah pasar yang sangat ramai, dengan sejumlah startup dan lainnya mengeluarkan banyak alat yang semuanya bekerja dengan baik dalam mengidentifikasi apa yang dikatakan orang dan menyalinnya secara akurat.



Di bagian depan transkripsi dan area di mana Descript bekerja, saingannya termasuk orang-orang seperti Trint, Wreally dan Otter, di antara banyak lainnya. Decript sendiri bahkan tidak membuat perangkat lunak NLP dasarnya; menggunakan Google, karena NLP dasar sekarang merupakan area yang pada dasarnya telah menjadi "dikomodifikasi," kata Mason dalam sebuah wawancara.



Itu membuat pembuatan fitur baru, memanfaatkan AI dan kemajuan lainnya, semuanya lebih penting, seperti yang kita lihat untuk melihat apakah satu alat muncul sebagai pemimpin yang jelas dalam bidang SaaS khusus ini.



“Dalam kolaborasi multiuser langsung, masih belum ada alat lain di luar sana yang telah melakukan apa yang telah kami lakukan dengan file audio besar yang tidak terkompresi. Itu bukan prestasi kecil, dan perlu waktu untuk memperbaikinya, ”kata Mason. “Saya telah melihat manifes transisi ini dari dokumen ke spreadsheet ke desain produk. Tidak ada yang akan memikirkan sesuatu seperti desain produk menjadi ruang besar tetapi hanya dengan mengambil alat ini untuk kolaborasi dan berhasil memindahkannya ke cloud, perusahaan seperti Figma telah muncul. Dan itulah bagaimana kami terlibat di sini. "

  

0 komentar:

Translate

Arsip Blog

Entri Populer