Digitalización

Este apartado tiene como objetivo establecer las especificaciones mínimas para digitalizar y elaborar un producto sustentable que no necesitará digitalizarse nuevamente durante un período prolongado de tiempo. 

Las especificaciones que a continuación se anotan son resultado de la experiencia en la elaboración del repositorio institucional, como parte del ecosistema digital de la biblioteca, y la creación de servicios digitales. Se actualizarán conforme se identifiquen mejoras. Las recomendaciones se basan en un análisis informal de las prácticas de digitalización en instituciones académicas y de investigación, así como dependencias gubernamentales.  También se definieron tomando en cuenta la infraestructura humana y tecnológica de El Colegio de México. Se recomienda que cualquier institución externa que desee adoptarlas considere su infraestructura local. 

Es importante tener en cuenta que estas especificaciones no son una solución a los problemas más importantes relacionados con la preservación digital en sí misma y sólo deben tomarse como referencia.

Documentos de Texto 

Preservación 
DOCX- MS Word Open XML  
ODT-OpenDocument Text Document
TXT-Plain Text File (ANSI or UTF-8) 
RTF-Rich Text Format File 
XML-(Extensible Markup Language)

Formato de preservación: PDF/A

Acceso 
PDF optimizado con reconocimiento de Texto
TXT

Para documentos escaneados de texto
Lo preferible es que el documento se le de un tratamiento con OCR si es que el documento lo permita, lo cual implica una revisión y corrección al mismo.

Presentaciones

Preservación 
Powerpoint (Microsoft Office): PPTX 
OpenDocument Presentation (Openoffice) : ODP
PDF/A
.MP4
.TIFF

Acceso 
PDF Optimizado para acceso con reconocimiento de Texto 

Hojas de Calculo

Preservación & Acceso
XLSX 
ODS 
CSV
TSV

Sonoro 

Preservación 
WAV
AIFF
FLAC
OGG 

Fuentes analogicas deberian ser transferidas a digital a 24bits and 96kHz 

Fuentes Digitales a resolución original
(típicamente 16 – 24 bits  y entre 44.1kbps- 48 kbps)

Acceso 
MP3: 128 kbps 

Imágenes en movimiento 

Preservación & acceso
MP4 con codificación H.264
Chroma Sampling: 4:2:0

Resolución por formatos

Pelicula Filmica: por determinar 

Beta Resolucion de 330×480 para Umatic, 

Betamax Super Betamax, Betacam: Resolucion de 400×480 y relación de aspecto 4:3

Extended Definition Betamax: Resolucion de 670×480: y relación de aspecto 4:3

LaserDisc, Super VHS, Hi8: Resolucion de 560×480: para y relación de aspecto 4:3 

VHS: por segundo (FPS): 30fps, resolución de 720 x 480, relación de aspecto 4:3 

DVD: 640×480 

Correos Electrònicos

Preservación y Acceso 

MBOX:Mailbox File 

Bases de Datos 

Preservación
JSON

Acceso
JSON 
XML
TSV 
CSV

Imágenes Fijas 

Preservación 
TIFF
Formatos AI, EMF, and WMF Se Convierten a .svg 
PS y EPS se convierten a PDF/A. 

Acceso 
JPG
PNG
PDF 

Digitalización de Imágenes

Texto, ilustración gráfica/obras de arte, mapas, planos, y materiales de formato grande. 

Escaneo: Bit Depth: 300 dpi, 8-bit grayscale 
Compresión: sin compresión or compresión sin pérdidas utilizando LZW o JPEG2000  

Blanco y negro  
Compresión: sin compresión o compresión G4 de CCITT 
Profunidad de Bits: 300 dpi, bitonal  

Escala de Grises  
Compression: sin compresión or Lossless compressed using LZW or JPEG2000  
Profunidad de Bits: 300 dpi, 8-bit grayscale  

* excepto en el caso de determinados usos de la documentación en que se requiere más resolución.

Color 
Compresión: Sin compresión
Profundidad de Bits:: 300 dpi, 24-bit color  

Digitalización de Fotografías

Matriz de Pixeles – 3000 píxeles a través de la dimensión larga para todos los formatos rectangulares y tamaños.
2700 píxeles para los formatos cuadrados independientemente de su tamaño.
Resolución
35mm: 2100 ppi 
4”x5” (10x12cm): 600 ppi
8”x10” (20,32×25,4 cm) : 300 ppi

Profundidad de Bits 
Cuanto mayor sea la profundidad de bits del escáner, el más exacto y preciso cuando se hace el análisis de la información por tonos disponibles y reproducción de color. Desde un escáner con una densidad óptica superior obtiene más información tonal para analizar y reproducir, es más preciso.