22 de septiembre de 2008

Sonido Digital - Parte IV

Con este Post terminamos con el tema:
Introduccion al Sonido Digital
La Proxima Semana Continuamos con Nuevo Tema.
Cualquier Duda: elbarrioestudio@hotmail.com



FORMATOS

Los datos son principalmente imágenes, sonidos, e información alfanumérica y para cada clase de dato existen diferentes formatos en los que se puede organizar para su procesamiento y/o transmisión

Los formatos son principalmente de dos clases:

el formato análogo y el formato digital; dentro de cada uno de estos formatos existen divisiones que crean las distinciones particulares.

Por ejemplo, cuando se habla de formato “carta”, se refiere a un formato en papel
(análogo), con unas dimensiones de 216 X 279 mm. o cuando se habla de formato de “sobre monarca” se habla de un formato análogo de 98 X 190 mm.

Otro ejemplo de formato análogo es un disco de acetato (LP) medio que se usó por mucho tiempo como la mejor manera de almacenar sonidos.

También se clasifican dentro del formato análogo las fotografías convencionales sobre papel fotográfico o transparencia.

Los formatos digitales, son la forma de representar elementos, utilzando sistemas computarizados; y como sabemos, estos en su mas mínima expresión se reducen a secuencias de unos y ceros que combinados representan códigos que pueden ser interpretados como una letra, como un color, una frecuencia, etc.

Dentro de los formatos digitales se encuentran: Formatos gráficos como BMP, JPG, GIF, etc., formato tipo texto, como: TXT, DOC, PDF, HTML etc., formatos de sonido, como: WAV, Real Audio ó MP3, formatos de video, como, AVI y MPEG, entre muchos otros.

FORMATOS POPULARES

.aiff: formato de sonido bastante comúnmente encontrado en la Web.

* Tipo de archivo: Binario
* A pesar de ser un formato Macintosh, también puede ser utilizado en otras
plataformas. Requiere los mismos programas que .au para reproducirlo.

.mp3: El formato de archivo más popular en la Web para la distribución de música con calidad de CD. Un archivo de 1Mb equivale a aproximadamente un minuto de música.

*Tipo de archivo: Binario
*Este tipo de archivo requiere un reproductor de MP3, disponible para
Macintosh y Windows.

.ra: Un formato propietario de secuencia de audio llamado RealAudio.

*Tipo de archivo: Binario
*Creado por RealNetworks, RealAudio le permite reproducir sonidos en
tiempo real. Este tipo de archivo requiere el RealPlayer, disponible
para Macintosh y Windows.

.wav: El formato de sonido nativo para Windows.

*Tipo de archivo: Binario
*En Mac puede utilizar el Sound App para reproducir archivos .wav.
*Para PC, utilice Waveform Hold and Modify o Goldwave para reproducir
estos archivos.

También hay un buen programa llamado Win Play!
que reproducirá estos así como otros formatos populares.

MP3 - MPEG 1 layer 3.

Las siglas MP3 responden a una abreviación de MPEG 1 layer 3.

Es un algoritmo de codificación perceptual desarrollado por el consorcio
MPEG (Moving Picture Expert Group) junto con el Instituto Tecnológico
Fraunhofer que finalmente se ha estandarizado como norma ISO-MPEG
Audio Layer 3 (IS 11172-3 y IS 13818-3) y que viene a ser un avance
importante sobre los anteriores desarrollos (Layer 1 y Layer 2).

El hecho de que haya sido adoptado como una norma ISO es más importante de lo que cabría suponer.

Las normas ISO definen muchos estándares del mercado y tienen peso frente a la industria. Además eso habilita a las personas que quieran desarrollar aplicaciones o cualquier otra cosa dado que tiene a su alcance el funcionamiento del sistema.

Esta tecnología no es nueva, realmente ya lleva desarrollándose más de 10 años, lo que ocurre es que ahora es el momento en el que la velocidad de proceso de los ordenadores la han hecho accesible para el usuario medio.

Codificación Perceptual y Oído Humano.

El sistema de codificación perceptual es un sistema de compresión con pérdida, esto quiere decir que el sonido original y el comprimido no son exactamente iguales. Estas pérdidas responden al funcionamiento del oído humano, así aunque los sonidos no son iguales si los percibimos como si lo fuesen.

Se suele comparar el sistema de compresión perceptual del sonido con los sistemas de compresión gráficos JPEG.

Estos se diferencian de otros como el BMP o TIFF porque no mantiene la imagen inalterada sino que realizan "aproximaciones" al original en pos de una mayor compresión.

El rango de frecuencias que percibe el oído humano esta aproximadamente entre los 20Hz y los 20kHz siendo más sensible entre los 2Hz y 4Hz.

Además cuando tenemos una señal de un volumen alto en una frecuencia y otra de un volumen más bajo en una frecuencia cercana esta queda "tapada" por la anterior. Esto es lo que se llama efecto enmascaramiento.

Así pues de lo que se trata es de aprovechar los "defectos" del oído humano para desechar todo aquello que realmente no vamos a oír.

Porsupuesto cada uno tiene su oído y por eso para probar el éxito de estos sistemas se utilizan métodos estadísticos.

Codificación de Sub Bandas.

Para aprovechar estas características se utiliza un sistema denominado Codificación de Sub Bandas.

En este proceso la señal original se descompone en sub bandas mediante un banco de filtros o algún método parecido.

Estas sub bandas son comparadas con el original mediante el modelo psicoacústico que determina que bandas son importantes cuales no y cuales pueden ser eliminadas.

Dependiendo del bitrate al que vayamos a producir la codificación este proceso eliminara más o menos datos siguiendo el modelo psicoacústico hasta lograr la compresión necesaria.

Luego se cuantifican y codifican las sub bandas restantes y el resultado es finalmente comprimido mediante un algoritmo Standard Huffman o LZW.

Cifras.

Dentro del formato MP3 podemos comprimir con distinto ancho de banda, modo y bitrate obteniendo distintas calidades según para que vayamos a utilizar ese sonido.




En un disco compacto tenemos una onda de 44.1kHz 16bit estéreo eso
significa aproximadamente 1400Kbps (44100 x 16 x 2 bits por segundo).

Codificándolo por ejemplo a un MP3 de 128kbps obtenemos una reducción en torno al 1/12 del espacio inicial.

También se puede optar por compresiones a mayor bitrate llegando a 192 o incluso 256kbps. Pero el más popular es el de 128kbps con el que se consigue una calidad excelente con una compresión sobresaliente.

bit

Acrónimo de Binary Digit (dígito binario).

Un bit es la unidad mínima de información empleada en informática.

Representa un uno o un cero (abierto o cerrado, blanco o negro, cualquier sistema de codificación sirve).

A través de secuencias de bits, se puede codificar cualquier valor discreto como, por ejemplo, números, palabras e imágenes.

Debido a que los equipos electrónicos digitales, internamente estos responden a dos tipos de estados eléctricos on y off, estos estados son dos condiciones, nosotros representamos estos como dos números 0 y 1 y la aritmética que trata con estos dos estados es llamada binary arithmetic.

series de bits son usados para representar números mayor a 1 (combinaciones de dígitos usados para representar números mayores que 9 en nuestro sistema de numeración decimal) los bits en series de 8 son llamados bytes y un byte usualmente representa un solo carácter de datos en el computador.


Números binarios


Piensa en números binarios como si fueran interruptores, con dos interruptores puedes representar 4 números diferentes



Mira el numero decimal versus el numero de números, dos números binarios nos da el decimal 3, pero hay cuatro números actualmente, en nuestro sistema decimal, nosotros rara vez pensamos en el cero; con computadores, cero es siempre pensado como un numero.

De esta manera, entonces un solo bit representa 2 números, dos bits representan 4 números, tres bits 8 números, cuatro 16 números,… 8 números representan 256 números, cada bit adherido dobla el numero de los números, pero mientras 8 bits representan 256 números el byte
11111111 es igual al decimal 255.


Bits y números o posibilidades

1 = 2
2 = 4
3 = 8
4 = 16
5 = 32
6 = 64
7 = 128
8 = 256
9 = 512
10 = 1024
11 = 2048
12 = 4096
13 = 8192
14 = 16384
15 = 32768
16 = 65536

Para mostrarte la correspondencia entre números binarios y decimales puedes ver la tabla siguiente.

Los números binarios estan formados tal como los decimales, excepto que hay solo dos números con los cuales trabajar.

Agotando estos dos números y empezando otra vez con la siguiente posición hacia la izquierda que se llena con un 1 cuando has llegado abajo con 111 tu simplemente empiezas la serie completa de nuevo con un 1 en frente, de esta forma cada vez que agregas un digito binario hacia la serie tu efectivamente doblas el numero de los números decimales disponibles para usar.

Mira la tabla. Un bit cuenta hasta dos números, dos bits cuenta para 4 números, tres bits 8 números, cuatro bits a 16 números, cinco a 32, seis a 64, siete a 128, y finalmente un byte 8 bits a 125 números




Es fácil confundirse cuando en el punto de cero se convierte en un digito, un byte con todos los dígitos ON representa el numero decimal 255, es difícil de visualizar esto cuando es el digito 256 avo en una serie, pero es exactamente eso lo que el computador demanda de ti.