CODIFICAÇÃO DE VOZ EM GSM 
 
 

Miguel Neves, nº52931

Instituto Superior Técnico

Av. Rovisco Pais, 1049-001 Lisboa, Portugal

E-mail: miguel.neves@tagus.ist.utl.pt 

Miguel Barroso, nº54444

Instituto Superior Técnico

Av. Rovisco Pais, 1049-001 Lisboa, Portugal

E-mail: miguel.barroso@tagus.ist.utl.pt 
 
 

1. ABSTRACT

2._INTRODUÇÃO

3._CONTEXTUALIZAÇÃO_DO_GSM

4._ARQUITECTURA_DA_REDE

5._ARQUITECTURA_DO_TERMINAL

   5.1._Codec_de_Voz

    5.2._Processamento_da_Fala

    5.3._Processamento_de_Sinal_

    5.4._Codec_de_Banda_de_Base

    5.5._A_Secção_Rádio

6._CODIFICAÇÃO

    6.1._Alternativas_

    6.2_Codificação_em_GSM

    6.3_Futuro_do_codificador

7._LICENCIAMENTO_DO_GSM

8._CONCLUSÃO

9._REFERÊNCIAS_


1. ABSTRACT

Pretende-se dar uma visão geral do GSM neste artigo. Faz-se em primeiro lugar uma contextualização histórica das comunicações e do GSM em particular.

Explicam-se aspectos relativos à infra-estrutura necessária a uma rede baseada nesta tecnologia, tendo o cuidado de familiarizar o leitor com a nomenclatura utilizada e com alguns aspectos técnicos e que descrevem o GSM.

Verificam-se ainda a arquitectura de um terminal móvel deste tipo. Faz-se uma abordagem genérica a todos os componentes e analisa-se com algum detalhe não só o codificador de voz utilizado bem como as suas alternativas.

O artigo termina falando dos aspectos relativos ao licenciamento e apresenta alguns exemplos relevantes de processos anteriores.

2. INTRODUÇÃO

Desde cedo, a necessidade de comunicar marcou o desenvolvimento da sociedade Humana. No final do século XX, surgiu finalmente a tecnologia que permitiu revolucionar a ideia de comunicar, o GSM.

O GSM (Groupe Spécial Mobile) surgiu de um esforço conjunto de diversos países, em 1982 no sentido normalizar as especificações das comunicações móveis europeias, no contexto de um comité denominado por CEPT (European Conference of Postal and Telecommunication Administrations).

Foi a partir do GSM, que as comunicações de voz se tornaram, pela primeira vez, simultaneamente síncronas, portáveis, fiáveis, em tempo real e acessíveis à maior parte da população.

3. CONTEXTUALIZAÇÃO DO GSM

As ondas electromagnéticas e fundamentalmente as leis de Maxwell permitiram revolucionar o mundo das comunicações. Foi a partir da introdução do telégrafo que pudemos pela primeira vez falar em telecomunicações. Posteriormente, a invenção do telefone permitiu introduzir a ideia de transportar um sinal de voz sobre uma linha telefónica ainda que sob a forma de um sinal analógico.

A primeira ideia de telecomunicações sem um meio de transmissão físico nasce como na maior parte dos casos de uma aplicação militar e é introduzida na sociedade com o serviço de rádio táxis, e rádio polícia que tinha já uma estrutura parecida com uma rede celular ainda que muito mais primitiva.

O sistema evolui para uma arquitectura que muito embora não seguisse um modelo celular, permitia a utilização da rede pública e de um sistema de numeração – o 0G ou mobile radio telephone.

De seguida, foi introduzida a primeira arquitectura que se assemelha às actuais, o 1G. O 1G é uma solução inteiramente celular, o que permite maior escalabilidade, e foi criado em 1980. Um dos sistemas mais conhecidos foi o AMPS (Advanced Mobile Phone System), sistema esse que apesar de analógico continuou em utilização até ao início deste ano, mais concretamente até ao dia 18 de Fevereiro.

Por esta altura (finais dos anos 80) tornou-se evidente que de modo a providenciar as comunicações móveis de maior mobilidade, dever-se-ia utilizar uma solução mais escalável, que permitisse serem adicionados e removidos serviços e aumentar a qualidade do sinal. A alternativa era a digitalização do sinal.

Ao digitalizar o sinal passamos a usufruir dos seguintes benefícios

Este passo marcou o aparecimento das redes 2G, e deu origem a três sistemas concorrentes: o DAMPS (Digital AMPS), e o GSM. 

Your browser may not support display of this image.

Figura 1 - Número de assinantes analógico vs digital

O DAMPS também conhecido como IS-54 surgiu da necessidade que os países (principalmente no continente norte americano) que já tinham implementado o AMPS tiveram de alterar o sistema para digital sem o refazerem de raiz, permitindo compatibilidade com os sistemas mais antigos. A solução acabou por se mostrar insuficiente acabando por ser substituída pelo GSM devido à capacidade da segunda de aprovisionar mais clientes. 

Your browser may not support display of this image.

Figura 2 - Número de assinantes total vs GSM

4. ARQUITECTURA DA REDE

O grande objectivo desta arquitectura é suportar um sistema de telecomunicações móvel e celular (GSM) que permita roaming por toda a Europa suportando serviços compatíveis com RDIS e outros PTSN (Redes de Comutação de Pacotes).

O sistema é baseado em TDM/FDM (Time/Frequency Division Multiplexing) e em TDMA (Time Division Multiple Access). A multiplexagem utilizada disponibiliza 124 bandas de frequência, cada um das quais dividida em 8 ou 16 tramas temporais.

A modulação utilizada é GSMK (Gaussian Minimum-Shift Keying), que permite reduzir a interferência nos canais vizinhos.

Your browser may not support display of this image.

 

 

 

 

 

Figura 3 - Arquitectura da Rede

Passasse então a descrever os vários componentes desta arquitectura que se divide em três componentes principais: a RSS (Radio Sub System) que cobre aspectos da interface rádio, NSS (Network and Switching SubSystem) que trata do estabelecimento e continuidade da chamada e OSS (Operation Sub System) que é responsável pela gestão da rede.

O sistema de RSS é composto por vários BSS (Base Station Subsystem) e estes representam cada BSC (Base Station Controler) e mais as antenas ou BTS’s (Base Transceiver Station) que este controla.

O sistema de NSS/OSS é por sua vez composto por 4 módulos principais: o MSC (Mobile Service Switching Center) que é responsável por estabelecer e terminar as chamadas bem como da cobrança das mesmas, o HLR (Home Location Register) que é uma entidade lógica única dentro de cada operadora, responsável por manter o registo e informação sobre todos os clientes da mesma, o VLR (Visitor Location Register) é responsável por manter um registo de todos os terminais ligados à BSS administrada pelo MSC ao qual está associado, e o GMSC (Gateway MSC) que faz a interligação entre a rede GSM e as redes fixas.

5. ARQUITECTURA DO TERMINAL

Para que se possa ter um entendimento cabal do funcionamento do GSM, é necessário perceber quais os blocos funcionais de um terminal móvel que utilize esta tecnologia. Propõe-se ao leitor na próxima secção uma abordagem genérica de cada um destes blocos de acordo com o modelo apresentado na figura 4. Poderão existir arquitecturas mais complexas e com mais componentes, mas o objectivo é dar a conhecer uma arquitectura simples e funcional.

Your browser may not support display of this image.

Figura 4 – Diagrama de blocos de um terminal GSM

5.1. Codec de Voz

 

O bloco do codec de voz faz conversões entre as funções de processamento da fala, do domínio digital, e entre o domínio analógico no exterior do terminal móvel. É composto por dois conversores, o conversor analógico/digital (ADC) que converte o sinal proveniente do microfone e o conversor digital/analógico (DAC) que converte o sinal para enviar para as colunas. A saída do ADC, um stream de 104kbps, vai ser mais tarde a entrada do codec do GSM.

5.2. Processamento da Fala

 

É neste bloco funcional que se introduz a noção de compactação do stream. A ideia é reduzir o débito de 104kbps para um débito mais aceitável na ordem dos 13kbps. É utilizado um codec de voz híbrido que utiliza noções quantificação e eliminação de redundância com algumas perdas em relação á informação original. O processo de descodificação é análogo e permite enviar dados de entrada para o DAC do bloco anterior. É interessante referir que existem módulos análogos nas BSS’s e nos MSC’s.

Podem-se introduzir algumas funcionalidades adicionais bastante relevantes. Nomeadamente extrapolação e substituição de tramas perdidas, importantes quando as condições de recepção são adversas, o detector de actividade de voz (VAD) que em conjunto com as funções de redução de ruído, como por exemplo a transmissão descontinua (DTX), permitem detectar situações em que não existe actividade interrompendo a transmissão poupado efectivamente bateria e reduzindo a interferência em células adjacentes.

5.3. Processamento de Sinal

 

O bloco de processamento de sinal trabalha com os dados do utilizador, bem como com a informação de sinalização e controlo de informação. Os dados a ser transmitidos sobre o canal de rádio têm de ser protegidos e essas medidas têm de ser desfeitas na recepção.

São neste bloco aplicadas técnicas de interleaving e CRC de forma a fazer recuperação e detecção de erros, cifra para assegurar a privacidade dos utilizadores, ordenamento das tramas e modulação (para GMSK).

Teve de se garantir também que na recepção existem não só as funções inversas e que nos permitem construir a entrada do descodificador, mas também se achou de bom senso incluir um equalizador que permite anular efeitos de interferência inter-simbólica, fading selectivo e efeito de Doppler, introduzidos pelos diferentes meios de transmissão, velocidade dos terminais e possíveis reflexões e/ou refracções do sinal.

5.4. Codec de Banda de Base

 

Este bloco converte e recebe dados de analógico para digital e vice-versa. As funções são muito similares às do primeiro bloco mas têm como alvo a rede, e a sua respectiva interface rádio, em vez do utilizador. Todas as operações realizadas são feitas já em banda de base, e por dois ADC’s e dois DAC’s.

5.5. A Secção Rádio

 

Esta secção é a interface entra o terminal móvel e a BSS à qual está associado. Mais em detalhe é composto por um sintetizador de frequências, um oscilador local, filtros, amplificadores de potência de transmissão, um controlador de ganho, corrector de frequência, entre outros.

6. CODIFICAÇÃO

6.1. Alternativas

 

Comece-se por analisar as várias alternativas de codificação de voz de entre as quais se pôde escolher para processar a voz no seu formato digital: PCM, codificadores de onda, vocoders e codificadores híbridos.

Na procura de uma solução teve de se considerar dois factores: a qualidade da voz e o débito necessária para representar o sinal. A qualidade da voz tem uma implicação directa com a satisfação dos clientes em relação ao serviço prestado. O débito tem implicações em relação ao investimento. O GSM é uma tecnologia que utiliza um meio partilhado de transmissão e como tal quanto maior o débito maior o investimento em em estações de retransmissão de rádio (BTS’s). 

A primeira alternativa já era utilizada largamente nas redes de transmissão de voz digitais como por exemplo as linhas RDIS. Implica uma utilização directa do teorema da amostragem que nos diz que em condições ideais um sinal analógico pode ser reconstruído a partir de uma sequência periódica de amostras desde que a frequência de amostragem seja no mínimo o dobro da frequência máxima do sinal original. Assim sendo, e uma vez que a voz humana tem sensivelmente como frequência máxima 3.4 kHz, utiliza-se uma frequência de amostragem de 8 kHz. Utilizam-se 8 bits para discretizar o sinal em 256 valores (correspondentes a amplitudes aproximadas do sinal analógico). Estes 256 “patamares” são suficientes para um sinal de voz. Esta alternativa produz um débito de 64 kbps que é claramente inadequado. 

Your browser may not support display of this image.

      Figura 5 – Dicretização para 4 bits

 

A segunda alternativa era a codificação de onda. A ideia por de trás deste tipo de codificadores é começar a explorar a redundância típica num sinal de voz. Esta exploração pode ser feita no domínio do tempo ou da frequência. Tomando como exemplo o segundo domínio, começa-se por partir a onda original num conjunto de sub frequências. Em vez de passar o valor da amplitude para cada uma destas envia-se antes uma diferença para o valor da onda anterior. Este tipo de representação mostrasse particularmente eficiente quando combinado com um codificador entrópico. Outra optimização introduzida foi permitir que os meus passos de quantificação pudessem passar a ser variáveis de acordo com a sensibilidade associada ao ouvido humano. Estas técnicas permitiam reduzir o ritmo de transmissão necessário para valores entre 16 e 40 kbps. Apesar dos resultados qualitativos serem muito bons era necessário comprimir ainda mais o sinal. 

Uma terceira alternativa foi a utilização de vocoders. Estes codecs têm uma abordagem à codificação de voz que passa por entender o processo de formação da mesma no tracto vocal. Basicamente podemos dividir o tipo de sons produzido em dois: os sons vozeados, que representam as vogais e que dão origem a um tipo de sinal mais regular e periódico, e os sons não vozeados (consoantes) e que dão origem a um tipo de sinal mais arbitrário e espalhado ao longo do espectro, assemelhando-se a ruído.

A ideia é achar uma frequência fundamental produzida pela voz humana e a partir dai medir a variação para essa frequência. Uma maneira se fazer isso é através de predição linear, que estima o valor da próxima amostra através de um conjunto de parâmetros (zeros e pólos de um modelo fonte-filtro) e de um erro associado a esta predição, que terá à partida uma energia bastante inferior em relação à da amostra inicial. Para a reprodução de sons vozeados é feita através da excitação de um filtro periodicamente e precisamos de saber a distância (no domínio do tempo) entre impulsos. Para a reprodução dos outros sons precisamos de uma excitação muito mais aleatória.

No final precisamos apenas de enviar quatro informações: coeficientes do filtro, indicação do tipo de som, o ganho e o período do sinal para os sons vozeados. Este modelo permite reduzir o débito para valores perto dos 2.4 kbps mas têm a o problema de tornarem a voz muito artificial e de serem mais complexos. Apesar destes defeitos, esta solução encontrasse já muito perto da solução final. 

Your browser may not support display of this image.

      Figura 6 - Modelo de um vocoder

Por último temos o método de codificação híbrida. Este método resulta de uma abordagem que inclui as vantagens das duas anteriores. Este vai ser o método escolhido para codificar o GSM. 

6.2 Codificação em GSM 

O GSM utiliza um método de predição linear. Este método consiste em correlacionar a amostra de sinal a transmitir com as amostras anteriores. O método é extremamente simples. Considera-se um conjunto de entrada PCM amostrado a 8 kHz e com quantificação de 13 bits (segundo a norma G.711). Este conjunto é depois dividido em 160 amostras para cada 20 ms. Estas amostras são transformadas, através de um métodos de LPC (Linear Predictive Coding) em 8 coeficientes (que vão parametrizar o nosso filtro) e num sinal residual. Estes coeficientes são posteriormente quantificados, com um número de bits variável, conforme se verifica na tabela 1, e que vão totalizar 36 bits. No fundo, é como se quiséssemos que alguém no receptor ouvisse uma música e lhe estivéssemos a passar a pauta em vez de a tocarmos directamente.  

I nº bits
1 6
2 6
3 5
4 5
5 4
6 4
7 3
8 3
 

Tabela 1 – Nº de bits utilizados na quantificação

Este método tem a clara desvantagem, de introduzir um efeito de bloco para as amostras perto da fronteira dos subconjuntos. Podemos facilmente minimizar este efeito pesando os coeficientes para as primeiras amostras com os coeficientes das amostras anteriores. O peso dos coeficientes anteriores vai deixando de ter importância até que desaparece por completo à 40ª amostra.

A partir destes coeficientes consegue-se calcular o sinal de resíduo que vai ser útil na minimização do ruído introduzido pela quantificação através de uma técnica denominada por LTP (Long Term Prediction). É calculado um sinal de resíduo para cada 40 amostras o seja para cada 5 ms. A frequência deste sinal é codificada com 7 bits e o seu ganho com 2 bits e são estes os parâmetros a utilizar no filtro que gera este sinal. O resíduo passa ainda por um filtro passa baixo que degrada o sinal com a intenção de reduzir o débito num bloco denominado por RPE (Regular Pulse Excitation). O resultado final é um débito que ronda os 4 e os 16 kbps. 

Mais especificamente, o método descrito até agora é um dos modos de codificação, possíveis em GSM e é denominado por Full Rate Coder (FR). Este nome advém do facto de que utiliza um débito de 12.2 kbps e como tal funciona no modo de 8 tramas por cada banda de frequência. Existem mais dois modos: Half Rate (HR) e Enhanced Full Rate (EFR). O método HR é muito similar ao FR mas consegue comprimir o débito para 5.6 kbps à custa de uma maior degradação do sinal. A sua utilização permite a utilização de 16 tramas por cada banda de frequência permitindo um maior número de utilizadores por cada BTS. O seu lançamento foi feito após a introdução do modo FR, e chegou a ser ponderado a utilização de HR em células com muita sobrecarga de utilizadores ou como um serviço de menor qualidade e consequentemente mais barato. Apesar destes estudos, a utilização deste método nunca chegou a ser massificada.

Por último, temos o modo EFR. Este modo permite-nos a utilização de 8 ou 16 tramas em cada uma das bandas de frequência sendo que cada um destes sub-modos conserva as características dos anteriores. A grande alteração, que trouxe foi melhorar os seus antecessores para que o modo de 8 tramas pudesse entregar pela primeira vez em GSM uma qualidade equivalente a uma linha tradicional, enquanto que o modo de 16 tramas pudesse ser utilizado com uma qualidade bastante razoável em condições com pouca interferência.

Your browser may not support display of this image.

Figura 7 – Exemplo de alguns terminais GSM

Como curiosidade acrescenta-se que o modo gasta mais 5% de bateria, e o utilizador pode inclusive forçar a utilização deste modo em alguns terminais da NOKIA com a introdução do código *3370#. Constatou-se com alguma tristeza que o código não funciona para os terminais e/ou operadoras dos escritores do presente documento. 

6.3 Futuro do codificador 

O último modo falado, o EFR foi utilizado e estendido com a utilização integral de uma família de codificadores denominada por AMR (Adaptative Multi-Rate) e continua a ser utilizado hoje em dia em tecnologia 3G como um dos sucessores do GSM – o UMTS (Universal Mobile Telecommunication System). Existem agora uma panóplia de 14 modos de codificação, todas baseadas em AMR, e que o terminal móvel e a BS (Base Station, sucessora das BTS’s) podem negociar de acordo com as condições de transmissão/recepção e distância.

Neste momento, está-se a entra numa nova era com o desenvolvimento do 4G. O objectivo das novas tecnologias, passa por tornar o mundo que conhecemos num ambiente ubíquo em que todos os equipamentos que conhecemos vão ter de alguma forma uma capacidade de comunicação móvel associada. Este desenvolvimento passa também pela atribuição de larguras de banda muito mais elevadas, bem como pela criação de novos protocolos e modos mais eficientes de comunicação que possibilitem estas novas taxas de transmissão e até capacidade de trocar informação relevante com terminais tão pequenos como do tamanho de partículas de pó.

7. LICENCIAMENTO DO GSM

Um aspecto relevante de qualquer tecnologia que tenha pretensões de utilização pública o custo do seu licenciamento, e o GSM não é excepção. Este factor, associado ao custo de construção e manutenção da infra-estrutura, contribui significativamente para a dificuldade que uma determinada empresa tem de penetrar o mercado. Habitualmente existe uma entidade pública que oferece uma ou mais licenças para venda num determinado país. Existe depois ou um processo de leilão ou então é fixado um preço fixo e os melhores projectos ganham o concurso. Em Portugal a entidade que gere este licenciamento é a ANACOM (Autoridade Nacional de Comunicações). Alguns casos de estudo interessantes são os da Nigéria, França, Kuwait, e da Telecom em Marrocos. 

Tendo estado sob a alçada de um regime militar até ao final de 1999, e sendo o país com maior população no continente africano, com 131.530.000 habitantes em 2004, a Nigéria sofre de vários problemas de corrupção e subdesenvolvimento. Quando o licenciamento do GSM neste pais foi feito em 2000 era preciso que fosse organizado num prazo tão curto quanto 5 meses. O licenciamento acabou por ocorrer em Dezembro de 2000, e foi supervisionado por uma consultora internacional, a RSI.

Dos dois métodos disponíveis, foi escolhido o método do leilão. Se por um lado este método garante que o governo não tem qualquer interferência politica na escolha, uma vez que ganham as melhores ofertas, por outro lado garante também de uma forma um pouco subjectiva que as propostas escolhidas são as melhores. As empresas que pagam mais pela licença serão inevitavelmente também aquelas que valorizam mais o seu projecto.

O concurso teve início a 20 de Dezembro com um valor de licitação mínima de $20 Milhões de US dollars. De inicio 8 empresas concorreram, e a licença acabou por ser vendida no dia seguinte a 3 empresas pelo valor de $285 Milhões de US Dollars. 

O caso da França é particularmente interessante pela forma de pagamento. Existem três licenças atribuídas e cada uma das empresas tem de pagar uma taxa anual de €30 Milhões de EUR acrescida de uma taxa de 1% de todas as vendas. Para que se tenha uma noção do volume de negócios do GSM, o Governo Francês estudava em 2004 a possibilidade de colocar um imposto para mensagens e de subir a taxa para 5% de forma a reduzir a divida pública do país. 

Um consórcio liderado pelo Kuwait's Mobile Telecom Co. (MTC) fez a oferta mais elevada para a Arábia Saudita da terceira licença móvel com uma oferta de SR22.91 bilhões (€ 6,11 mil milhões de euros) para entrar no maior mercado móvel no Médio Oriente. O processo foi gerido pela Comissão das Comunicações e Tecnologia da Informação (CITC), reguladora das telecomunicações para o Kuwait e requereu uma aprovação do Governo.  

É também interessante saber que a empresa portuguesa PT e a Telefónica ganharam agora pela segunda vez em 1999 um licenciamento para GSM em Marrocos. O processo foi mediado pelo Rei e pelo Primeiro-ministro marroquinos, e a proposta consegui ganhar a propostas vindas de empresas como a France Telecom, a Vivendi/SBC, a Vodafone/Airtouch entre outros.

8. CONCLUSÃO

Este documento teve como objectivo dar uma visão geral do sistema GSM. Corremos o risco de deixar bastantes detalhes relativos ao GSM por explicar, mas o objectivo é que o leitor fique com uma ideia de referência que lhe permita mais tarde explorar alguns dos aspectos aqui abordados.

O GSM foi a primeira abordagem para desenvolver um sistema de comunicações pessoais, em que tanto o utilizador como o dispositivo são móveis, garantindo a continuidade das comunicações através do serviço de roaming.

A digitalização inerente à codificação GSM permite a integração de novos serviços como o SMS, serviço de fax e de transferência de dados.

O GSM é um padrão muito complexo, mas esse é provavelmente o preço que tem de ser pago para alcançar o nível de serviço integrado e de qualidade oferecido enquanto sujeito às bastante severas restrições impostas pelo meio de transmissão das ondas rádio.

9. REFERÊNCIAS

  1. Siegmund M. Redl, Matthias K. Weber, Malcolm W. Oliphant (May 1998): "GSM and Personal Communications Handbook", Artech House, ISBN 978-0890069578.
  2. Www.wikipedia.org
  3. http://www.arabnews.com/?page=6&section=0&article=94165&d=25&m=3&y=2007
  4. http://www.wirelessweek.com/france-sets-gsm-license-renewal.aspx
  5. www.ncc.gov.ng/speeches_presentations/EVC's%20Presentation/GSMlicensing_process.pdf
  6. http://findarticles.com/p/articles/mi_m0EIN/is_1999_August_6/ai_55373032
  7. http://kbs.cs.tu-berlin.de/~jutta/gsm/js-intro.html
  8. http://users.isr.ist.utl.pt/~ricardo/GSM/index.html
  9. http://comp.ist.utl.pt/rci-rmsf/


Neves, Miguel nascido em São Sebastião da Pedreira, Lisboa, Portugal a 25/01/1984. Encontra-se presentemente a terminar a Licenciatura em Engenharia de Redes e Comunicação e a frequentar o Mestrado em Engenharia de Redes de Comunicação ambos no Instituto Superior Técnico em Lisboa. 

 

Barroso, Miguel nascido em Santa Maria, Lagos, Portugal a 05/07/1985. Encontra-se presentemente a frequentar o Mestrado em Engenharia de Redes de Comunicação no Instituto Superior Técnico em Lisboa.