martes, 16 de octubre de 2012

Organización secuencial y organización directa


Organización

Se refiere al método utilizado para acceder a los registros de un archivo prescindiendo de su organización. Existen distintas formas de acceder a los datos:
Organización secuencial
  • Acceso secuencial se refiere a que un grupo de elementos es accedido en un predeterminado orden secuencial un registro a la vez). El acceso secuencial es a veces la única forma de acceder a los datos, por ejemplo en una cinta de casete.
  • Secuenciales; los registros se leen desde el principio hasta el final del archivo, de tal forma que para leer un registro se leen todos los que preceden.

Procesar una secuencia de datos en orden.

Organización directo

cada registro puede leerse / escribirse de forma directa solo con expresar su dirección en el fichero por él numero relativo del registro o por transformaciones de la clave de registro en él numero relativo del registro a acceder.

Archivo Secuencial Indexado

Definición
Estos archivos mantienen las características básicas de los archivos secuenciales  los registros se organizan en secuencia basada en un campo clave pero se agregan dos características: un índice del archivo para soportar los accesos aleatorios.

Operaciones sobre archivos
Las distintas operaciones que se pueden realizar a  los registros de un archivo son:

martes, 9 de octubre de 2012

Unidades transferencia de archivos


Unidades


La transferencia de datos se expresa en bits por segundo.

Kb (Kilobit) = 1,000 bits

Mb (Megabit) = 1,000,000 bits

Gb (Gigabit) = 1,000.000,000 bits

Tb (Terabit) = 1,000,000,000,000 bits

Pb (Petabit) = 1,000,000,000,000,000 bits

Eb (Exabit) = 1,000,000,000,000,000,000 bits

Zb (Zettabit) = 1,000,000,000,000,000,000,000 bits

Yb (Yottabit) = 1,000,000,000,000,000,000,000,000 bits

En mi investigación pude encontrar los siguientes datos curiosos e interesantes que a continuación presentare:
1 MB (Megabyte) | 1, 048,576 Bytes | 8, 388,608 bits
Una diskette de 3,5 pulgadas (sostiene realmente sobre 1.38Mb)
2 megabytes: Una fotografía muy de alta resolución
5 megabytes: 30 segundos de vídeo de la TV-calidad (imagínese cómo es grande es una película de 2 horas)
10 megabytes: Un minuto del sonido de alta fidelidad
20 megabytes: Una web entera con base de datos
700 megabytes: Una "copia más oscura"-ROM Típica. Aproximadamente 80 minutos de música

1 GB (Gigabyte) | 1024 MB | 1,073,741,824 Bytes | 8,589,934,592 bits
1 gigabyte: Un carro de recolección llenó del papel - o película de A en la calidad de la TV 2 gigabytes:
20 metros de libros dejados de lado #
4,6 gigabytes: un CD lleno de DVD
40 gigabytes: PC casero (2000-2001)
80 gigabytes: PC casero (2002-2003)
120 gigabytes: PC casero (2003-2004)
1000 gigabytes: Un piso de diarios académicos 
1 TB (Terabyte) | 1024 GB | 1,048,576 MB | 8,388,608 KB | 1,099,511,627,776 Bytes | 8,796,093,022,208 bits.

1 Terabyte: Todas las películas de radiografía en un Terabyte tecnológico grande del hospital
10: La colección impresa de la biblioteca de los E.E.U.U. del congreso


1 PB (Petabyte) | 1024 TB | 1,048,576 GB | 1,073,741,824 MB | 1,099,511,627,776 KB | 1,125,899,906,842,624 Bytes | 9,007,199,254,740,992 bits.

1 Petabyte: 3 years of EOS data (2001)
200 Petabytes: Todo el material impreso
500 Petabytes: Todos los datos en línea por el año 2000

1 EB (Exabyte) | 1024 PB | 1,048,576 TB | 1,073,741,824 GB | 1,099,511,627,776 MB | 1,125,899,906,842,624 KB | 1,152,921,504,606,846,976 Bytes | 9,223,372,036,854,775,808 bits.
# 5 Exabytes: Todas las palabras habladas siempre por los seres humanos 

1 ZB (Zettabyte) | 1024 EB | 1,048,576 PB | 1,073,741,824 TB | 1,099,511,627,776 GB | 1,125,899,906,842,624 MB | 1,152,921,504,606,846,976 KB | 1,180,591,620,717,411,303,424 Bytes | 9,444,732,965,739,290,427,392 bits


1 YB (Yottabyte) | 1024 ZB | 1,048,576 EB | 1,073,741,824 PB | 1,099,511,627,776 TB | 1,125,899,906,842,624 GB | 1,152,921,504,606,846,976 MB | 1,180,591,620,717,411,303,424 KB | 1,208,925,819,614,629,174,706,176 Bytes | 9,671,406,556,917,033,397,649,408 bits 



Conclusiones
El Data Warehouse es un Almacén de datos centralizado donde requiere de un software que permite conocer mejor el perfil del cliente y poder dar respuesta a sus necesidades. En este sistema se basan las estrategias del Marketing One to One. Empresas reconocidas que utilizan el Data Warehouse son British Airways, Union Pacific, Air France, Coca-Cola, Adidas, Nike, 3M, Bosh Siemens... aquellas que manejan grandes volúmenes de datos relativos a clientes, compras, marketing, transacciones, operaciones. Es difícil encontrar pequeñas y medianas empresas que utilicen estos sistemas ya que es de muy alto costo.
1.- ¿Cómo eran al principio?, ¿Cumplían las mismas funciones que ahora?
La metodología de diseño de arriba hacia abajo genera puntos de vista dimensional muy consistente de los datos en los data marts ya que todos los puestos de datos se cargan desde el repositorio centralizado. Diseño top-Down también ha demostrado ser robustos frente a cambios en el negocio. La generación de nuevos puestos de datos dimensional frente a los datos almacenados en el almacén de datos es una tarea relativamente simple. La principal desventaja de la metodología de arriba hacia abajo es que representa un proyecto muy grande, con un alcance muy amplio.
2.- ¿Es costoso?
Si, además de que es difícil encontrar pequeñas y medianas empresas que utilicen estos sistemas ya que es de muy alto costo.

Cybergrafia
Glosario
Zettabyte: Un zettabyte es una unidad de almacenamiento de información cuyo símbolo es el ZB, equivale a 1021 bytes.
El prefijo viene adoptado en 1991, viene del latín "septem", que significa siete (como hepta-), pues equivale a 10007.
1 ZB= 103 EB = 106 PB = 109 TB = 1012 GB = 1015 MB = 1018 kB = 1021 bytes
1000 zettabytes equivalen a un yottabyte.

Una definición más amplia de almacén de datos
Los medios para obtener y analizar esos datos, para extraerlos, transformarlos y cargarlos, así como las diferentes formas para realizar la gestión de datos son componentes esenciales de un almacén de datos. Muchas referencias a un almacén de datos utilizan esta definición más amplia. Por lo tanto, en esta definición se incluyen herramientas para la inteligencia empresarial, herramientas para extraer, transformar y cargar datos en el almacén de datos, y herramientas para gestionar y recuperar los metadatos.




Data WareHouse


Data WareHouse

En el contexto de la informática, un almacén de datos (del inglés data warehouse) es una colección de datos orientada a un determinado ámbito (empresa, organización, etc.), integrado, no volátil y variable en el tiempo, que ayuda a la toma de decisiones en la entidad en la que se utiliza. Se trata, sobre todo, de un expediente completo de una organización, más allá de la información transaccional y operacional, almacenada en una base de datos diseñada para favorecer el análisis y la divulgación eficiente de datos. El almacenamiento de los datos no debe usarse con datos de uso actual. Los almacenes de datos contienen a menudo grandes cantidades de información que se subdividen a veces en unidades lógicas más pequeñas dependiendo del subsistema de la entidad del que procedan o para el que sea necesario.
Otra definición de Data Warehouse:
Es un repositorio de datos de muy fácil acceso, alimentado de numerosas fuentes, transformadas en grupos de información sobre temas específicos de negocios, para permitir nuevas consultas, análisis, reporteador y decisiones, siendo muy costoso.

Los usuarios de un Data Warehouse necesitan accesar a los datos complejos, frecuentemente desde fuentes múltiples y de formas no predecibles.
Los usuarios que accesan a los datos operacionales, comúnmente efectúan tareas predefinidas que, generalmente requieren acceso a una sola base de datos de una aplicación. Por el contrario, los usuarios que accesan al data warehouse, efectúan tareas que requieren acceso a un conjunto de datos desde fuentes múltiples y frecuentemente no son predecibles. Lo único que se conoce (si es modelada correctamente) es el conjunto inicial de datos que se han establecido en el depósito.
Por ejemplo, un especialista en el cuidado de la salud podría necesitar accesar a los datos actuales e históricos para analizar las tendencias de costos, usando un conjunto de consultas predefinidas. Por el contrario, un representante de ventas podría necesitar accesar a los datos de cliente y producto para evaluar la eficacia de una campaña de marketing, creando consultas base o ad-hoc para encontrar nuevamente necesidades definidas.








Conclusiones
Me sorprende la cantidad de memoria que se utilizaba años atrás como un diskette de 3,5 in (1.38Mb), siendo de gran utilidad para el usuario y actualmente micro SD de miles de veces más grandes en cuanto a capacidad y con un tamaño físico muy reducido o tambien los 1000 Gb aproximados a un piso de libros académicos. En algún momento me pregunte si los Zettabyte se utilizaban en algún proyecto o alguna empresa mundial, y viendo un ejemplo encontré que 5 Zettabytes son equivalentes a todas las palabras habladas siempre por los seres humanos, siendo algo de un tamaño inmenso, pero no imposible, en estos tiempos.
El Data Warehouse es un Almacén de datos centralizado donde requiere de un software que permite conocer mejor el perfil del cliente y poder dar respuesta a sus necesidades. En este sistema se basan las estrategias del Marketing One to One. Empresas reconocidas que utilizan el Data Warehouse son British Airways, Union Pacific, Air France, Coca-Cola, Adidas, Nike, 3M, Bosh Siemens... aquellas que manejan grandes volúmenes de datos relativos a clientes, compras, marketing, transacciones, operaciones. Es difícil encontrar pequeñas y medianas empresas que utilicen estos sistemas ya que es de muy alto costo.
1.- ¿Cómo eran al principio?, ¿Cumplían las mismas funciones que ahora?
La metodología de diseño de arriba hacia abajo genera puntos de vista dimensional muy consistente de los datos en los data marts ya que todos los puestos de datos se cargan desde el repositorio centralizado. Diseño top-Down también ha demostrado ser robustos frente a cambios en el negocio. La generación de nuevos puestos de datos dimensional frente a los datos almacenados en el almacén de datos es una tarea relativamente simple. La principal desventaja de la metodología de arriba hacia abajo es que representa un proyecto muy grande, con un alcance muy amplio.
2.- ¿Es costoso?
Si, además de que es difícil encontrar pequeñas y medianas empresas que utilicen estos sistemas ya que es de muy alto costo.


Cybergrafia

martes, 2 de octubre de 2012

VISIÓN GENERAL DE LOS MODELOS DE BASES DE DATOS


VISIÓN GENERAL DE LOS MODELOS DE BASES DE DATOS
Teoría o especificación que describe como una base de datos es estructurada y usada. Varios modelos han sido sugeridos.

  • Modelos comunes:
  • Modelo jerárquico
  • Modelo de red
  • Modelo relacional
  • Modelo entidad-relación
  • Modelo objeto-relacional


Modelo de objeto también define el conjunto de las operaciones que pueden ser realizadas sobre los datos.
El modelo relacional, por ejemplo, define operaciones como selección, proyección y unión.

Modelos
Se utilizan varias técnicas para modelos las BDD. La mayoría son construidos en torno a un modelo de datos particular, aunque sea cada vez más común para productos ofrecer el apoyo a más de un modelo donde ofrecerán al usuario algún nivel de control en la sintonía de la puesta en práctica.

Modelo de tabla
Consiste en una serie única, bidimensional de elementos de datos, donde todos los miembros de una columna dada son asumidos para ser valores similares, y todos los miembros de una fila son asumidos para ser relacionados el uno con el otro. Por ejemplo, columnas para el nombre y la contraseña que podría ser usada como una parte de una base de datos de seguridad de sistema. Cada fila tendría la contraseña específica asociada con un usuario individual. Las columnas de la tabla a menudo tienen un tipo asociado con ellos, definiéndolos como datos de carácter, fecha o la información de tiempo, números enteros, o números de punto flotante.

 

Modelo jerárquico
En un modelo jerárquico, los datos son organizados en una estructura parecida a un árbol, implicando un eslabón solo ascendente en cada registro para describir anidar, y un campo de clase para guardar los registros en un orden particular en cada lista de mismo-nivel. Las estructuras jerárquicas fueron usadas extensamente en los primeros sistemas de gestión de datos de unidad central, como el Sistema de Dirección de Información (IMS) por la IBM, y ahora describen la estructura de documentos XML. Esta estructura permite un 1:N en una relación entre dos tipos de datos. Esta estructura es muy eficiente para describir muchas relaciones en el verdadero real; recetas, índice, ordenamiento de párrafos/versos, alguno anidó y clasificó la información. Sin embargo, la estructura jerárquica es ineficaz para ciertas operaciones de base de datos cuando un camino lleno (a diferencia del eslabón ascendente y el campo de clase) también no es incluido para cada registro.
Una limitación del modelo jerárquico es su inhabilidad de representar manera eficiente la redundancia en datos. Los modelos de base de datos " el valor de atributo de entidad " como Caboodle por Swink están basados en esta estructura.
En la relación Padre-hijo: El hijo sólo puede tener un padre pero un padre puede tener múltiples hijos. Los padres e hijos son atados juntos por eslabones "indicadores" llamados. Un padre tendrá una lista de indicadores de cada uno de sus hijos.


Modelo de red
El modelo de red (definido por la especificación CODASYL) organiza datos que usan dos fundamentales construcciones, registros llamados y conjuntos. Los registros contienen campos (que puede ser organizado jerárquicamente, como en el lenguaje COBOL de lenguaje de programación). Los conjuntos (para no ser confundido con conjuntos matemáticos) definen de uno a varias relaciones entre registros: un propietario, muchos miembros. Un registro puede ser un propietario en cualquier número de conjuntos, y un miembro en cualquier número de conjuntos.
El modelo de red es una variación sobre el modelo jerárquico, al grado que es construido sobre el concepto de múltiples ramas (estructuras de nivel inferior) emanando de uno o varios nodos (estructuras de nivel alto), mientras el modelo se diferencia del modelo jerárquico en esto las ramas pueden estar unidas a múltiples nodos. El modelo de red es capaz de representar la redundancia en datos de una manera más eficiente que en el modelo jerárquico.
Las operaciones del modelo de red son de navegación en el estilo: un programa mantiene una posición corriente, y navega de un registro al otro por siguiente las relaciones en las cuales el registro participa. Los registros también pueden ser localizados por suministrando valores claves.




Modelo Dimensional
El modelo dimensional es una adaptación especializada del modelo relacional, solía representar datos en depósitos de datos, en un camino que los datos fácilmente pueden ser resumidos usando consultas OLAP. En el modelo dimensional, una base de datos consiste en una sola tabla grande de hechos que son descritos usando dimensiones y medidas.
Las dimensiones tienden a ser discretas y son a menudo jerárquicas; por ejemplo, la ubicación podría incluir el edificio, el estado, y el país.
Una medida es una cantidad que describe el hecho, tales como los ingresos. Es importante que las medidas puedan ser agregados significativamente - por ejemplo, los ingresos provenientes de diferentes lugares pueden sumarse.
En una consulta (OLAP), las dimensiones son escogidas y los hechos son agrupados y añadidos juntos para crear un reporte.
El modelo dimensional a menudo es puesto en práctica sobre la cima del modelo emparentado que usa un esquema de estrella, consistiendo en una mesa que contiene los hechos y mesas circundantes que contienen las dimensiones. Dimensiones en particular complicadas podrían ser representadas usando múltiples mesas, causando un esquema de copo de nieve.
Un almacén de datos (data warehouse) puede contener múltiples esquemas de estrella que comparten tablas de dimensión, permitiéndoles para ser usadas juntas. La llegada levanta un conjunto de dimensiones estándar y es una parte importante del modelado dimensional.


Modelo de objeto
En años recientes, el paradigma mediante objetos ha sido aplicado a la tecnología de base de datos, creando un nuevo modelo de programa sabido(conocido) como bases de datos de objeto. Estas bases de datos intentan traer el mundo de base de datos y el uso que programa el mundo más cerca juntos, en particular por asegurando que la base de datos usa el mismo sistema de tipo que el programa de uso. Esto apunta para evitar el elevado (a veces mencionaba el desajuste de impedancia) de convertir la información entre su representación en la base de datos (por ejemplo como filas en mesas) y su representación en el programa de uso (típicamente como objetos). Al mismo tiempo, las bases de datos de objeto intentan introducir las ideas claves de programa de objeto, como encapsulación y polimorfismo, en el mundo de bases de datos.
Los otros han atacado el problema a partir del final de base de datos, por definiendo un modelo de datos mediante objetos para la base de datos, y definiendo un lenguaje de programación de base de datos que permite a capacidades de programa llenas así como instalaciones de pregunta tradicionales.
Las bases de datos de objeto han sufrido debido a la carencia de estandarización: aunque las normas fueran definidas por ODMG, nunca fueron puestas en práctica lo bastante bien para asegurar la interoperabilidad entre productos. Sin embargo, las bases de datos de objeto han sido usadas satisfactoriamente en muchos usos: Usualmente aplicaciones especializadas como bases de datos de ingeniería, base de datos biológica molecular, más bien que proceso de datos establecido comercial. Sin embargo, las ideas de base de datos de objeto fueron recogidas por los vendedores emparentados y extensiones influidas hechas a estos productos y de verdad a la lengua SQL.