¿Qué es Unicode?

Solicite su comparativa GRATIS

Indique qué módulos necesita

Con la garantía de:
 

¿Qué recibirás a cambio?

Ranking
personalizado de los mejores proveedores.

Información detallada de los proveedores de software.

White paper sobre software de gestión de cliente

Unicode es un estándar de codificación de caracteres creado para facilitar el tratamiento informático, así como la transmisión y la visualización de textos de múltiples lenguajes y disciplinas técnicas. El término Unicode proviene de los tres objetivos perseguidos: universalidad, uniformidad y unicidad.

Unicode asigna un nombre e identificador numérico único para cada carácter o símbolo, el code point o punto de código, aparte de otras informaciones necesarias para su uso correcto: direccionalidad, mayúsculas y otros atributos. Unicode trata los caracteres alfabéticos, ideográficos y símbolos de forma equivalente, es decir, se pueden mezclar en un mismo texto sin la introducción de marcas o caracteres de control.

Este estándar industrial proporciona el medio por el cual un texto en cualquier forma e idioma puede ser codificado para el uso informático. Este estándar representa caracteres como enteros, Unicode utiliza 16 bits para cada carácter a diferencia del ASCII que utiliza 7 bits por carácter. Esta diferencia hace que pueda representar más de 65 mil caracteres únicos. Para idiomas como el inglés, español y otros idiomas europeos el ASCII es suficiente. La necesidad de más caracteres surge por idiomas más complejos como el japonés, el chino o el griego entre otros.

Este estándar es sostenido por el UTC (Unicode Technical Committee) integrado en el Consorcio Unicode, en el que forman parte con diferentes grados de implicación empresas tan conocidas como Microsoft, Adobe, Ibm, Apple, Oracle entre otras. El Consorcio Unicode sostiene una estrecha relación con ISO/IEC (International Organization for Standardization y por la comisión International Electtrotechnical Commission) con quien tiene un acuerdo para sincronizar sus estándares que contienen los mismos caracteres y puntos de código.

En procesamiento de textos, Unicode es el encargado de aportar un único punto de código para cada carácter

Representa un carácter de forma abstracta y deja la representación visual a otro software como un procesador de texto o navegador web. Aún así, esta simplicidad se complica con las concesiones realizadas por los creadores de Unicode con ánimo de conseguir más usuarios.

Los primeros 256 puntos de código son idénticos a los especificados en ISO8859-1 para facilitar la conversión del texto ya existente escrito en lenguajes europeos occidentales. Muchos de los caracteres especiales se codificaron varias veces en distintos puntos de código de salvaguardar distinciones utilizadas por codificaciones heredadas y permitir conversiones de aquellas codificaciones a Unicode sin perder ningún tipo de información.

La principal ventaja de Unicode es su capacidad de almacenar caracteres que no son ASCII como la “ñ” española. El carácter Unicode para la ñ es 0xf1 en hexadecimal (241 en decimal), que se puede escribir así: xf1.

Los esquemas de codificación tratan de la forma en que se serializa la información.

Volver al glosario de términos

 
 

EL 70% IMPLANTA UNO DE LOS
Encuentra el mejor software ERP con nuestro comparador gratuito QUE LE PROPONEMOS

Comparamos entre más
de 200 soluciones

Ahorramos más de
70 horas de trabajo

Damos un informe
personalizado

Somos gratis,
neutrales y rápidos