GarToolsPremium Tools
Audio

Metadatos ID3 explicados: qué guarda tu MP3 (y cómo editarlo sin perder calidad)

Guía técnica al estándar ID3v1, ID3v2.3 e ID3v2.4: qué son los frames, qué diferencia hay entre COMM y TXXX:comment, cómo guardan tags WAV, FLAC, M4A y OGG, y por qué editar metadatos no degrada un solo bit del audio.

Por Ferran Garola Bonilla13 min de lectura
Imagen ilustrativa del artículo: Metadatos ID3 explicados: qué guarda tu MP3 (y cómo editarlo sin perder calidad)
Compartir

Qué hay realmente dentro de un archivo MP3

Cuando arrastras un MP3 a tu reproductor favorito y aparece la portada del disco, el nombre del artista y el año de publicación, no estás viendo información que el reproductor consulta en internet: vive dentro del propio archivo. Esa información se llama metadatos ID3, y es un estándar abierto, libre y gratuito que se mantiene desde 1996.

Un archivo MP3 está dividido en dos partes lógicas:

  1. El audio comprimido: una secuencia de frames MP3 que codifican la música usando el estándar MPEG-1/2 Layer III. Es lo que el decodificador convierte en sonido al pulsar play.
  2. Los metadatos: una cabecera (al inicio del archivo en ID3v2) o una cola fija de 128 bytes (al final en ID3v1) que almacena texto e imágenes con información sobre la canción.

Las dos partes son independientes: editar metadatos no toca un solo byte del audio. Si comparas con un editor hexadecimal un MP3 antes y después de cambiar el título, los frames de audio son idénticos. Sólo cambia el bloque ID3.

ID3v1, ID3v2.3, ID3v2.4: tres estándares en el mismo apellido

ID3 ha tenido tres iteraciones públicas y conviene entender la diferencia, porque tu colección probablemente las mezcla todas:

ID3v1 (1996)

El abuelo. 128 bytes fijos al final del archivo. Empieza con la cadena ASCII TAG y reserva campos de longitud fija: 30 bytes para título, 30 para artista, 30 para álbum, 4 para año, 30 para comentario y 1 byte para género (codificado como número del 0 al 255 contra una tabla cerrada).

Limitaciones evidentes: no soporta acentos correctamente (es ASCII estricto, no UTF-8), no admite carátulas, no permite títulos largos, no tiene espacio para letras ni para más de un artista. Hoy en día sólo lo escribe software muy antiguo, pero millones de archivos lo conservan como respaldo.

ID3v2.3 (1999)

El estándar dominante en 2026. Se coloca al inicio del archivo (a diferencia de v1) y es extensible: en lugar de campos fijos, usa frames de longitud variable identificados por códigos de cuatro letras como TIT2 (título), TPE1 (artista) o APIC (carátula). Cada frame puede declarar su propia codificación: ISO-8859-1 (Latin-1) o UTF-16 con BOM.

Es el formato que recomiendan reproductores como iTunes, Apple Music, Plex, Rekordbox, Poweramp o el sistema de infoentretenimiento de prácticamente cualquier coche moderno. Por eso herramientas como nuestro editor de metadatos de audio escriben siempre ID3v2.3 en UTF-16: es la combinación con mejor compatibilidad universal.

ID3v2.4 (2000)

Una mejora técnica con UTF-8 nativo, mejor soporte para etiquetas de varios idiomas y campos de fecha más precisos. Pero paradójicamente menos compatible: muchos reproductores antiguos no lo entienden y el ecosistema iTunes nunca lo adoptó completamente. Por eso la convención de la industria sigue siendo escribir v2.3 y dejar v2.4 como caso especial.

Frames: el ADN de un tag ID3v2

Un frame es una unidad atómica de metadatos. Cada uno tiene tres partes: un identificador de 4 letras, una cabecera con el tamaño del payload, y los datos. Los más usados en la práctica son:

FrameSignificadoEjemplo
TIT2Título de la canción"Bohemian Rhapsody"
TPE1Artista (lead performer)"Queen"
TPE2Artista del álbum (band)"Queen"
TALBÁlbum"A Night at the Opera"
TYER / TDRCAño (v2.3 / v2.4)"1975"
TCONGénero"Rock" o "(17)"
TRCKNúmero de pista"11/12"
COMMComentario estándar"Ripped from CD original"
APICCarátulaimagen JPG/PNG embebida
USLTLetras (lyrics)texto multilínea
TBPMBPM (beats per minute)"143"
TKEYTonalidad musical"Cm"
TLANIdioma de la letra"spa"

A esto se suman los frames avanzados que casi nunca se editan a mano pero sí están presentes en muchos archivos:

  • TENCencoded by: quien codificó el archivo (por ejemplo "iTunes 12.10").
  • TSSEsoftware/hardware encoder settings: la configuración exacta del codificador, como "LAME3.100" o "Lavc61.19.100".
  • WXXXuser-defined URL: enlaces personalizados al artista, álbum o letra.
  • TXXXuser-defined text: la trampilla universal para tags personalizados.

El frame TXXX: el sospechoso habitual de la era IA

TXXX (User Defined Text Frame) es el cajón de sastre del estándar. Cualquiera puede crear un frame TXXX con una clave propia y un valor asociado. Esto es lo que permite que plataformas modernas guarden metadatos que el estándar no contempla.

Por ejemplo, si descargas un audio generado por Suno o Udio (las dos plataformas de música generativa más populares en 2026), encontrarás frames TXXX como:

  • TXXX:Suno_Version — versión del modelo
  • TXXX:prompt — el prompt original que generó la canción
  • TXXX:comment — un comentario personalizado de la plataforma
  • TXXX:replicate_uuid — identificador interno

Esto es legítimo y útil, pero confunde a los usuarios porque genera el clásico problema de dos comentarios distintos: el comentario estándar (frame COMM) y el comentario personalizado (frame TXXX:comment). En nuestro editor de metadatos los mostramos separados a propósito: COMM arriba en el formulario principal y los TXXX en la tabla de metadatos avanzados.

La diferencia exacta entre COMM y TXXX:comment

Es una pregunta que se hace cualquiera que abre un MP3 generado por IA y ve dos campos llamados "comentario". La respuesta corta: son dos frames distintos del mismo estándar.

COMM es el frame de comentario oficial. Su payload tiene tres componentes:

  1. Idioma: 3 letras ISO 639-2 (eng, spa, fra, ger...).
  2. Descripción corta: típicamente vacío o "iTunNORM", usado para distinguir varios COMM en el mismo archivo.
  3. Texto: el comentario libre que ves en tu reproductor.

TXXX:comment es un frame TXXX cuya clave de usuario es la cadena literal comment. Su payload sólo tiene dos componentes (descripción y valor) y no incluye idioma. Lo crea software que necesita guardar un comentario adicional sin sobrescribir el COMM existente.

Lo importante es que pueden coexistir: un mismo archivo puede tener un COMM con un texto y un TXXX:comment con otro distinto, y ningún editor inteligente debería borrar uno al editar el otro.

Cómo se guardan los tags en formatos que no son MP3

ID3 nació para MP3, pero la convención se ha extendido a otros formatos porque el problema de los metadatos es universal. Cada contenedor lo resuelve a su manera:

WAV: chunks RIFF y un id3 colgado

Un WAV es un contenedor RIFF (Resource Interchange File Format) compuesto por chunks consecutivos: fmt (formato del audio), data (PCM crudo), LIST (información de catalogación). La convención de ID3 para WAV es añadir un chunk llamado id3 (con espacio final, exigido por la especificación de 4 caracteres) cuyo payload es exactamente un tag ID3v2 idéntico al de un MP3. Esa convención la usan foobar2000, Audacity, VLC, ffmpeg y nuestro editor.

Inyectar tags en un WAV requiere parsear los chunks existentes, eliminar cualquier id3 previo, calcular la alineación a 2 bytes que exige RIFF y reescribir la cabecera con el nuevo tamaño total. Es delicado pero el audio PCM permanece bit a bit idéntico.

FLAC: METADATA_BLOCK_VORBIS_COMMENT

FLAC (Free Lossless Audio Codec) tiene su propio sistema: bloques METADATA_BLOCK_VORBIS_COMMENT con pares clave=valor en UTF-8. Las claves estándar son TITLE, ARTIST, ALBUM, DATE, TRACKNUMBER. Es el sistema más limpio de todos: simple, claro, multilingüe por defecto y sin la complejidad de los frames ID3.

M4A/MP4: atoms iTunes-style

Los contenedores MP4 (incluido el M4A para audio) guardan los tags en atoms dentro de la jerarquía moov/udta/meta/ilst. Apple definió las claves estándar (©nam para título, ©ART para artista, ©alb para álbum, etc.) cuando creó iTunes, y se han convertido en la convención universal del ecosistema MP4.

OGG: Vorbis Comments

Igual que FLAC, OGG (Vorbis u Opus) usa Vorbis Comments. La estructura es idéntica a FLAC pero embebida en las páginas OGG.

Por qué editar metadatos NO degrada el audio (con prueba)

Esta es la pregunta más recurrente cuando alguien edita un MP3 por primera vez: "¿pierde calidad si guardo de nuevo el archivo después de cambiar el artista?". La respuesta categórica es no, y se demuestra trivialmente.

El audio comprimido vive en frames MP3 (o muestras PCM en el WAV, o bloques FLAC, etc.) que están en una sección del archivo distinta del bloque de metadatos. Cuando un editor decente actualiza los tags, sólo reescribe el bloque ID3 al inicio (en el caso de v2.3) o el chunk id3 (en el caso de WAV) y deja todo lo demás intacto.

Puedes comprobarlo tú mismo: abre un MP3 con un editor hexadecimal, anota los bytes del audio (después del bloque ID3), edita el tag con cualquier editor moderno, vuelve a abrir y compara: idénticos. Cero re-codificación, cero pérdida.

El mito viene de programas mal diseñados de los años 2000 que efectivamente recodificaban el archivo entero al guardar. Hoy ningún editor serio lo hace.

Casos de uso reales en 2026

Organizar la biblioteca de música

Es el caso clásico. Spotify Local Files, Plex, Jellyfin, Roon, Apple Music con archivos locales, todos leen los tags ID3 para construir la vista por artista/álbum/género. Si descargas música de Bandcamp, ripeas un CD viejo o recuperas un disco duro antiguo, los tags suelen estar incompletos o incorrectos.

Limpiar audios generados por IA

Las pistas generadas por Suno, Udio o ElevenLabs vienen con docenas de frames TXXX que en general no quieres conservar (versiones internas, prompts, IDs de modelo). Limpiarlas antes de subirlas a un servicio de streaming personal o compartirlas evita desorden.

Archivar para la posteridad

Si grabas un podcast, un audiolibro casero o una serie de masterclases en MP3/WAV, embeber metadatos consistentes (TIT2 con el episodio, TPE1 con el autor, TALB con la temporada, APIC con la portada) es lo que separa una colección amateur de una colección que tu yo de dentro de diez años podrá organizar fácilmente.

Identificar la procedencia técnica

El frame TSSE (encoder settings) sirve a archivólogos digitales y radiofónicos para verificar que un MP3 fue generado con un codificador específico. Por ejemplo, "LAME3.100 -V0" indica un VBR de máxima calidad encoded con LAME, lo que es relevante para conservadores de archivos sonoros.

Edición práctica sin sufrir

Si has llegado hasta aquí, probablemente quieres editar tags ya. Tres caminos según tu volumen:

  • Un archivo o un álbum: nuestro editor de metadatos hace todo en el navegador, sin subir nada a un servidor. Lee los siete formatos más usados (MP3, WAV, FLAC, M4A, OGG, AAC, AIFF), permite editar todos los frames avanzados (TXXX, TENC, TSSE, COMM, etc.) y guarda en MP3 (ID3v2.3) y WAV.
  • Cientos de archivos: aplicaciones de escritorio como Mp3tag (Windows, gratis) o MusicBrainz Picard (multiplataforma, open source) son más eficientes para acciones masivas con autocompletado desde MusicBrainz/Discogs.
  • Pipeline de procesado: ffmpeg con -metadata permite escribir tags por lotes desde scripts y es la opción profesional para servicios automatizados.

Conclusión

Los metadatos ID3 son el ejemplo perfecto de un estándar que parece trivial pero esconde tres décadas de iteraciones, compromises y convenciones. Entender la diferencia entre un COMM y un TXXX:comment, saber por qué tu MP3 ripeado en 2003 todavía se ve borroso en una pestaña de iTunes moderna, o tener claro que editar tags nunca degrada el audio: son las pequeñas certezas técnicas que separan a quien organiza su música de quien la padece.

Si gestionas una biblioteca grande, aprende los códigos clave (TIT2, TPE1, TALB, TPE2, TYER, TCON, TRCK, COMM, APIC) y elige una herramienta que respete los frames avanzados sin borrarlos al guardar. Y si te tropiezas con un archivo lleno de TXXX extraños, ahora ya sabes que probablemente viene de Suno o un generador equivalente, y que puedes mantener esos tags o limpiarlos con conocimiento de causa.

¿Te ha sido útil este artículo?

Suscríbete a la newsletter mensual: un correo cuando publicamos algo igual de útil. Sin spam.

¿Te ha gustado?
Compártelo con alguien a quien le pueda ser útil.

Los comentarios se activarán próximamente. ¿Quieres compartir algo sobre este artículo? Escríbenos en /contacto.

Continuar leyendo
Volver al blog