Просмотр полной версии : Эксперименты с Audition
Эксперименты со звучанием средствами subj
Прикольно, а у кого-нибудь есть коллекция дополнительных плагинов к нему, чтоб голоса грабить? Чтобы можно было партии исполнителей менять.
Второй день экспериментов. Из привычных записей The Beatles получаются балдежные по звучанию композиции :)
Mad Killer/PG
21.01.2009, 20:23
Прикольно ей Богу!
Спасиб! Я тут се накачал мануалов по реставрации музыки, научился расширять стереоэффекты в стерео и стереозовать моно, чтоб звучало как в хорошей студии. Вчерась со "Стариком Хоттабычем" дрессировался. Спрошу и здесь и в другом треде: есть ли какой-нибудь нормальный midi->wav(mp3) конвертер, я нашел только варезный MIDI Converter Studio 6. Делает он всё классно, но там счетчик на 7 дней и дает записывать только первые 60 секунд. Попадись он мне в хорошие сытные времена, я б купил чессна слова. А нужно это для того, что в любой приставочный аппарат midi загонять гемморней, чем mp3. Да и как накладывать дополнительно треки (голос) с микрофона ума не приложу. В общем, кто может, давайте делиться опытом в этом треде. А Audition догадались кто? Только не говорите, если догадались, а то злые они все сичас без денех.
Тут мне ещё присоветовали XGPlayer вапще полный улёт че вытворяет даже из обычных (не XG)мидиков.
Эксперименты со звучанием средствами subj
Прикольно, а у кого-нибудь есть коллекция дополнительных плагинов к нему, чтоб голоса грабить? Чтобы можно было партии исполнителей менять.
расчленять сведенные песни на вокал и инструментал - это из разряда фантастики.
но примерно того же эффекта можно добиться путем сложения каналов с инверсией одного из них.
итак, в какую сторону копать.
в том же аудишне есть стандартные плагины: center channel extractor и channel mixer. попробуй играться с ними. последовательно, либо комбинируя.
сразу скажу, что для моно треков (либо псевдо-стерео, полученных из моно при помощи программных ухищрений) такая фигня не прокатит.
расчленять сведенные песни на вокал и инструментал - это из разряда фантастики.
ну люди-то как-то выделяют? и даже собаки :)
Пока что мне попадалась такая фигня, как в каждый голос вносить модуляцию птиц и животных. Ну там ослом проговорить какую-то фразу или быком. Прикольно. Но меня интересовало, когда я на это наткнулся проблема идентификации голоса. А выделение голоса(ов) людских из wav-ов более простая задача. Есть же проги, которые контролируют, правильно ли ты произносишь фразы-по английски.
А выделение голоса(ов) людских из wav-ов более простая задача.
я как звукорежиссер заверяю - это все равно, что из макарон с гуляшом получить живую корову. чистый голос из сведенной песни вычленить невозможно.
Ну, я не оспариваю. Ты профи, конечно! Я просто спрашиваю, как наше ухо выделяет? Даже если акапелло поют, мы ж все-равно слышим каждого! И если, допустим одного из трех убрать, тут же скажем, кого убрали. А вот когда пародисты говорят чужим голосом, то тут надо "напрячь мозг", чтобы почувствовать разницу. Далее, мы "слышим", что человек простужен, "говорит в нос". Некоторые люди, хоть и не пародисты, умеют исказить свой голос до неузнаваемости, а как по-разному они могут петь?! А еще есть возрастные изменения и эмоциональные окраски голоса. Значит эти "характеризуюший голос" параметры 1)конечны;2) существуют алгоритмы их выделения;3) они могут быть под контролем сознания человека, который может ими осознанно и довольно искусно при определенной степени тренированности управлять.
А выделение голоса(ов) людских из wav-ов более простая задача. Есть же проги, которые контролируют, правильно ли ты произносишь фразы-по английски.
это ты про выделение слов, а не голоса... слова можно худо-бедно распознать с нынешними технологиями, но оригинальный звук в приличном качестве "распознать" и синтезировать можно разве что с помощью человека с идеальным слухом, который этот звук слышал раньше. воткнуть ему в мозг электроды, и синтерзировать по слепку памяти :v2_devil:
при записи на студии получаются несклько дорожек, которые потом и сводятся в единый трек. обратный процесс в принципе невозможен. даже если оооочень сильно постараться, можно вырезать из трека определенный спектр частот. но т.к. голос занимает практически весь спектр средних частот, его вырезать оооочень сложно. можно добиться для него максимального уменьшения громкости путем сведения\инверсирования каналов, при этом остается от голоса эхо - эфект, который при мастеринге дает ревербератор. разложить же многоголосую партию невозможно. убрав часть частот для одного голоса также уберутся они и для другого. насчет того, что люди умудряются - все предельно просто. при наличии миди клавиатуры мы можем дописать (сыграть на ней) партии "вырезанных" вместе с голосом инструментов. тогда и получается, что фонограмма будет как настоящая. другой вариант - полностью написать каждую партию каждого инчтрумента и свести все енто. подобным образом можно изменить инструменты - т.е. записать партии другими инструментами. вот собственно и все.
Здесь при анализе нужен другой подход. Забыл как это называется, когда люди голосом имитируют муз. инструменты? В этом случае голос трудно выделить. Но слово, любое, на любом языке выделяется по характерным признакам. Поэтому на "первом проходе" выделяем в спектре те компоненты, которые "отвечают" за пропетые слова. Это может быть, конечно не человек "вживую", а даже синтезированное пение голосом. Неважно. Назовем это "поющий инструмент". Теперь задача выделить из общего трека те части, где он присутствует. Ясно, что простой инверсией и сложением, мы получим "тишину" в других фрагментах. Конечно останутся участки, где голоса не было слышно. Пока не будем с этим замарачиваться. Обратимся к другим, "подозрительным на голос". Вот тут уже нужна умная программа, распознающая слова, которые поют. Конечно певцы поют и всякое там "ля-ля-фа", но и это можно занести в словарь. А так, определив язык(а проще задав его принудительно), на котором поют, подключаем 1)словарь;
2) базу с фонемами и "погнали" на "сопоставление с образцом".
Теперь мы получили "синтезированный трек голоса", в котором понятны все слова(есть в словаре) и который суть последовательность спетых фонем ( не знаю, как это правильно называется) "ты размааааахом необъяяяяятнаааа" это примерно так выглядит а не "ты размахом необъятна". Теперь вычитаем этот трек из исходного. :) Что в исходном остается? Кажется всё, кроме этого голоса. Это конечно простейший случай, когда кто-то солирует.
теоретически очень даже понятно. но вот сами фонемы должны быть наверное не ввиде фраз... тут ведь и тембр голоса имеет основное значение. и мне почему-то кажется, что вычислить частоты относительно целиковой фонограммы, чтобы выделить из нее определенный голос не так то просто... ну я если честно сам тока теоретически это представляю. программы такие мне не попадались, иначе давно уже были бы в моем арсенале ;)
Вот с этого и надо начинать! Взять Opensource-ную "говорилку" и сделать на её основе "поючку". Научить её петь разными голосами.
Powered by vBulletin® Version 4.2.5 Copyright © 2025 vBulletin Solutions, Inc. All rights reserved. Перевод: zCarot