Categories
Historias de usuarios comunes

El misterio del archivo en formato ASCII, caso de la vida real.

Este problema ha estado rondando por mi cabeza durante varios días y aún no le encuentro una solución que me satisfaga. Les cuento para que me den su opinión al respecto.

El otro día un usuario vino a mi preguntándome sobre un archivo en formato ASCII y mi mente viajó a los años 90’s. Hasta recordé una fotocopia con los códigos de los caracteres porque en aquellos días usábamos ciertos símbolos para construir cajas en los menús de nuestros programas (aullaron coyotes en el cerro).

Copia del Código ASCII
Imagen cortesía de Olivia de Azul Celeste.

Le pedí que me mostrara los requisitos requeridos (la lista completa la pueden leer aquí: Inscripción en el RFC ). Hasta llegar al requisito en cuestión que es el número 4.

archivo en formato ascii

4. El formato del archivo debe ser en Código Estándar Americano para Intercambio de Información (ASCII).

¿Archivo de texto? ¡Obvio!

Aunque no lo menciona es claro que el archivo a entregar es un archivo de texto. Incluso los dos puntos anteriores nos dan una pista del contenido del archivo:

  • Sin tabuladores.
  • Únicamente mayúsculas.

Para generar un archivo de texto hay un montón de programas. Mis favoritos en Linux Sublime, Geany, Gedit, y en Windows el famoso Notepad++, vamos que por editores no paramos.

Y con eso podemos generar el archivo, sin embargo ¿A que se refiere con eso de formato ASCII?.

¿Será la codificación del archivo?

A lo mejor el requisito se refiere a la codificación del archivo. Pero como pueden ver en la siguiente imagen hay un montón de opciones y ninguna de ellas es ASCII.

Notepad++ mostrando las opciones de codificación.
Existe ANSI, pero no es ASCII.

La codificación de los archivos es importante para que se interpreten apropiadamente los textos, por ejemplo léase: Los subtítulos muestran letras raras.

Quiero suponer que a lo mejor lo que quieren es que no aparezcan vocales acentuadas o la letra Ñ del español. Pero incluso esas limitantes del código ASCII original fueron resueltas mediante páginas de códigos.

Este es un caso más para el pingüino que investiga. Aunque para ser sincero creo que es un callejón sin salida.

Ustedes que opinan ¿Cúal es su mejor teoría? ¿Qué es lo que habrán querido decir con este requisito?.

Misterio resuelto.

Gracias al comentario de Traktek parece que se ha resuelto el misterio, al menos de manera no oficial.

Él menciona el comando file para saber el tipo del archivo. Bueno, pues utilizando la codificación UTF-8 hice un sencillo archivo de prueba.

Archivo de prueba ASCII
Archivo de prueba

El comando file lo identifica como ASCII.

Y el resultado es que lo identifica como ASCII
file lo identifica como ASCII

Pero si al archivo le agrego una Ñ, la cosa cambia a UTF-8.

Archivo de prueba UTF8
El mismo archivo, pero ahora tiene una Ñ.
El resultado es que file lo identifica como UTF-8
El resultado es que file lo identifica como UTF-8

Y con eso ya tiene algo de sustento la teoría de que el archivo no debe de incluir letras acentuadas o la letra Ñ.

¡Muchas gracias Traktek por tu comentario!.

By linuxmanr4

Servidor y amigo. Me gusta mi ciudad, su historia, su comida y su gente. Soy el amigo tecnológico que le entiende a las computadoras y al Internet. Lagunero de nacimiento, Jerezano de corazón y linuxero por convicción.

2 replies on “El misterio del archivo en formato ASCII, caso de la vida real.”

Articulos relacionados:

Bueno, este detalle se puede resolver de manera fácil.

Cómo ya mostraste en la tabla de arriba, están los caracteres que se usan en ASCII, pero hay un problema, la parte de la tabla que se llama «ASCII extendido» no es correcta, US-ASCII solamente llega hasta el punto de código 127 (el número que aparece en la columna que está a la izquierda de cualquiera de los carácteres), que corresponde al caracter de control DEL, los caracteres del 128 en adelante no son propios de ASCII, sino de alguna otra codificación que lo extiende, pero que no es estríctamente ASCII.

Lo mejor que puedes hacer es usar UTF-8 (porque es compatible con ASCII hasta cierto punto), evitando usar acentos, la ñ y los símbolos «¿¡€», y si estás dudoso de que el archivo es completamente ASCII, lo que puedes hacer es ejecutar este comando en la terminal de Linux:

file archivo.txt

Te devolverá un texto similar a este:

hola.txt: ASCII text

Y con eso sabes si es ASCII o no.

Ten un buen día.

¡Me encantaría saber que opinas!

This site uses Akismet to reduce spam. Learn how your comment data is processed.