Uma primeira análise poderia apontar a utilização de formatos de áudio como o MIDI como chave para a resolução da questão aqui proposta. O formato MIDI descreve os ficheiros de áudio através das notas musicais e da sua força, funcionando como uma partitura digital. No entanto, poucas das músicas disponíveis na internet estão neste tipo de formatos. Não existindo também algoritmos que permitam a conversão de um ficheiro de áudio num formato mais vulgar como o MP3 para MIDI.
As principais características a ter em conta num sistema de pesquisa de queries áudio são:
A robustez prende-se com a necessidade da pesquisa não estar refém, dentro de certos limites, das condições de degradação do sinal. Analisando a hipótese de um utilizador querer saber a música que está a ouvir na rádio, o sinal que chega ao sistema de pesquisa de áudio sofreu degradações a quando do seu processamento na estação de rádio, na transmissão pela atmosfera, no caminho entre a coluna do rádio e o altifalante do telemóvel, na codificação de voz levada a cabo pelo telemóvel e na rede móvel. Também deve conseguir “fintar” os ruídos de fundos de carros ou o barulho no interior de uma discoteca.
Por fidedignidade entende-se que duas músicas distintas não podem gerar o mesmo índice de procura na base de dados.
É também importante ter em conta que os índices de pesquisa na base de dados não devem ser muito complexos e grandes pois isso levaria a atrasos na procura e à necessidade de ter bases de dados gigantes.
Quando se fala em granularidade entende-se que o sistema não deve exigir do utilizador que este forneça toda a extensão da música. Quanto menor for a granularidade do sinal para um grau de fidedignidade equivalente, melhor é o algoritmo.