Em entrevista, Geraldo Ramos falou sobre IA na indústria musical e no processo de criação de “desmixagem” de músicas
Em entrevista ao Crypto ID, Geraldo Ramos, Co-founder e CEO da Moises.ai fala sobre as aplicações da Inteligência Artificial (IA) na indústria musical e na criação de músicas.
Especialmente, Ramos explicou como a IA integra o processo de desmixagem de músicas – em que é realizada a separação dos sons que compõem uma canção.
Crypto ID: Como a tecnologia de desmixagem funciona na prática? É importante que você nos explique os princípios básicos da desmixagem, como a separação de vozes e instrumentos de uma música.
Geraldo Ramos: Nós utilizamos a inteligência artificial para analisar uma gravação estéreo, identificar os instrumentos individuais e, em seguida, isolar esses instrumentos, permitindo-nos gerar arquivos de som individuais para cada instrumento.
Em essência, a separação de fontes de áudio é como ter um detetive digital que pode pegar uma gravação e deduzir quais sons foram utilizados para criá-la, para depois nos devolver cada um desses sons como elementos separados e limpos. É um campo que combina acústica, processamento de sinais e inteligência artificial para resolver o quebra-cabeça do som mixado.
Crypto ID: Quais são as principais aplicações da tecnologia de desmixagem na indústria musical?
Geraldo Ramos: A separação de faixas (stem separation) possui diversas aplicações. Por exemplo:
Músicos – Músicos utilizam a separação de faixas com a gravação estéreo original para isolar um instrumento específico. Isso facilita para eles ouvirem e entenderem o que foi tocado sem que outros sons atrapalhem. Isso pode ser muito útil ao praticar uma parte musical. Em seguida, ao remover um instrumento, um músico pode tocar junto com a música como se estivesse se apresentando com o artista original. Um baterista poderia isolar as batidas para ouvir exatamente o que foi tocado e, em seguida, remover as batidas da música e tocar junto. Isso é muito útil para músicos que precisam aprender novas músicas para tocar ao vivo.
Produtores – Produtores musicais utilizam a separação de faixas no estúdio para isolar trilhas a serem usadas em remixes ou em produções nas quais desejam extrair apenas a voz do cantor.
Produção de filmes e TV – Mixadores de som utilizam a separação de faixas para isolar diálogos de músicas ou outros sons de fundo para limpar vídeos gravados em locações.
Produção de comerciais de TV – Gravadoras ou supervisores musicais em agências de publicidade usam a separação de faixas para remover vocais ou outros instrumentos de músicas, facilitando o uso de canções do catálogo existente sem a necessidade de regravá-las para comerciais de TV. Isso é útil, pois as gravadoras geralmente não têm acesso às faixas individuais (stems) das gravações.
Crypto ID: Como a IA está transformando a indústria musical? Você poderia citar exemplos de como a desmixagem está sendo usada para criar novos produtos e serviços musicais.
Geraldo Ramos: A inteligência artificial já está transformando a indústria da música de diversas maneiras. Gravadoras e artistas querem proteger sua propriedade intelectual, mas também estão explorando as oportunidades de negócios que a IA cria. Alguns exemplos:
A Separação de Faixas cria uma grande oportunidade para as gravadoras aumentarem a receita de seus catálogos existentes. Por exemplo, publicidade e outras formas de licenciamento para produção de TV/cinema, conforme descrito anteriormente.
As gravadoras também têm utilizado a Separação de Faixas para criar novas obras. No Brasil, temos como exemplo o trabalho de Luana Carvalho na canção “Visual”, do álbum Baile de Máscara. Na faixa, a artista pôde realizar uma parceria com sua mãe, Beth Carvalho, já falecida. Um sample da voz da famosa sambista foi retirado de uma canção de 1978, editado e incorporado à canção de 2020, fazendo com que as duas cantassem juntas.
A modelagem vocal impulsionada por IA também está conquistando seu espaço nas produções musicais. Recentemente, a Moises lançou o Voice Studio, pioneiro nessa área. Lançado com 11 vozes profissionais de alta qualidade, a ferramenta de modelagem de voz transforma a voz de um criador na de qualquer cantor e locutor em sua biblioteca.
Produtores que apresentam músicas à gravadoras, artistas ou outros podem acessar uma variedade de vozes – alterando a tonalidade, timbre e tipo de voz – para transmitir melhor sua visão criativa para suas faixas a possíveis colaboradores.
Empresas de produção de vídeo e áudio com pouco tempo para criar demos para clientes podem produzir e entregar o conteúdo rapidamente, prototipando e produzindo demos já em alta qualidade. As mesmas podem utilizar o Voice Studio para encontrar uma voz que tenha o “melhor fit” para a brand de seus clientes. Dessa forma, a contratação de profissionais de locução pode ser melhor planejada e programada.
A tendência de modelagem vocal também está sendo utilizada por artistas para criar novas fontes de receita e relacionamentos colaborativos mais sólidos com seus fãs. A artista Grimes, por exemplo, disponibilizou recentemente sua impressão vocal para que fãs e criadores pudessem criar novas faixas usando sua voz, dividindo os royalties de streaming com a artista.
Além da música, podemos ajudar grandes marcas globais a localizarem seus comerciais de TV, criando um modelo vocal com seus porta-vozes. Se essa pessoa só falar inglês, por exemplo, agora os comerciais têm sua voz falando perfeitamente diversos idiomas, em vários mercados globais, graças à IA.
Temos ainda a extração de letras (usando a IA para converter áudio vocal em texto), que já está sendo usada na distribuição digital para facilitar o processo de lançamento de novas músicas.
Crypto ID: Quais são os desafios e oportunidades da IA na indústria musical? Geraldo pode falar sobre a maneira como a IA está revolucionando a criação, produção e distribuição de música.
Geraldo Ramos: Um grande desafio para a indústria em geral está relacionado aos direitos autorais, já que as leis atuais geralmente não abordam especificamente a inteligência artificial. Na Moises, operamos com alguns princípios bem pensados. Entramos nesse negócio, primeiramente, como músicos e criadores, e respeitamos todos os músicos, vocalistas, compositores e detentores de direitos.
Abraçamos o poder da IA como uma ferramenta colaborativa e honramos a criatividade. Nosso objetivo é desenvolver ferramentas para complementar os processos criativos em áudio e música, não para substituir as pessoas. Acreditamos que a IA pode adicionar efetivamente valor à música e ao áudio sem violar os direitos de criadores, detentores de direitos ou indivíduos.
Crypto ID: Como a Moises se posiciona no mercado de IA para música? Geraldo pode falar sobre os diferenciais da plataforma e seus planos de expansão.
Geraldo Ramos: Treinar modelos de IA e expandir a infraestrutura necessária para lançar produtos e serviços de alta qualidade representa um desafio significativo para a indústria. Tivemos a sorte de poder crescer organicamente e construir nossa plataforma para atender às necessidades de nossa crescente base de clientes. Nossa escala é agora massiva, com 40 milhões de usuários de nossos produtos processando mais de um milhão de minutos de áudio diariamente. Isso nos proporcionou uma clara vantagem no mercado.
As preocupações sobre a segurança de obras protegidas por direitos autorais são uma grande questão para gravadoras, e construímos nosso negócio para ser amigável às gravadoras e à indústria, enquanto muitos outros trabalham fora do que consideramos fronteiras éticas – e possivelmente legais.
Crypto ID: Como ele acredita que a IA pode democratizar a criação musical e por outro lado, como a IA pode ajudar a preservar o legado musical?
Geraldo Ramos: Sim. Eu realmente acredito que a inteligência artificial pode – e já está – democratizando a criação musical. Fundamos a empresa com o objetivo de facilitar a jornada dos músicos ao aprenderem novas músicas e aprimorarem sua arte. Com mais de 40 milhões de pessoas usando a Moises, acredito que podemos dizer que ajudamos a democratizar a criação musical, disponibilizando ferramentas muito poderosas nas mãos do músico comum, não apenas dos profissionais.
Recentemente, a plataforma da Moises foi utilizada para restaurar o áudio no incrível documentário “Elis & Tom, só tinha de ser com você”, que retrata a criação do álbum “Elis e Tom”, de Elis Regina e Tom Jobim. Continuará havendo ótimas oportunidades para usar a inteligência artificial na preservação e celebração dos legados de muitos artistas históricos.
Startups usam Inteligência Artificial para revolucionar diferentes mercados
Crypto ID entrevista André Serpa, Vice-presidente da Neo4j para América Latina
Acompanhe o melhor conteúdo sobre Inteligência Artificial publicado no Brasil.
Junte-se a nós na construção de um futuro digital mais seguro e confiável!
Ao longo de dez anos, trilhamos um caminho de pioneirismo com foco em segurança digital, identificação e privacidade. Celebramos essa jornada com a certeza de que a confiança é a base para um futuro digital sólido e promissor.
Mas a nossa missão continua! Convidamos você, leitor, e sua empresa a se juntarem a nós nesta jornada em busca de um futuro digital ainda mais seguro e confiável. Acreditamos no poder da colaboração para construir um ecossistema digital onde empresas, máquinas e pessoas possam confiar muito mais uma nas outras.