Analisis y diseño de las bases de datos distribuidas
Obtener vínculo
Facebook
X
Pinterest
Correo electrónico
Otras apps
Objetivos
En el diseño de la distribución de los datos, se deben de tomar en cuenta los siguientes objetivos: Procesamiento local. La distribución de los datos, para maximizar el procesamiento local corresponde al principio simple de colocar los datos tan cerca como sea posible de las aplicaciones que los utilizan. Se puede realizar el diseño de la distribución de los datos para maximizar el procesamiento local agregando el número de referencias locales y remotas que le corresponden a cada fragmentación candidata y la localización del fragmento, que de esta forma se seleccione la mejor solución de ellas
Distribución de la carga de trabajo. La distribución de la carga de trabajo sobre los sitios, es una característica importante de los sistemas de cómputo distribuidos. Esta distribución de la carga se realiza para tomar ventaja de las diferentes características (potenciales) o utilizaciones de las computadoras de cada sitio, y maximizar el grado de ejecución de paralelismo de las aplicaciones. Sin embargo, la distribución de la carga de trabajo podría afectar negativamente el procesamiento local deseado.
Costo de almacenamiento y disponibilidad. La distribución de la base de datos refleja el costo y disponibilidad del almacenamiento en diferentes sitios. Para esto, es posible tener sitios especializados en la red para el almacenamiento de datos. Sin embargo el costo de almacenamiento de datos no es tan relevante si éste se compara con el del CPU, I/O y costos de transmisión de las aplicaciones..
Los pasos a seguir para diseñar una base de datos distribuida:
1. Diseño del "esquema conceptual" el cual describe la base de datos integrada (esto es, todos los datos que son utilizados por las aplicaciones que tienen acceso a las bases de datos).
2. Diseño "físico de la base de datos", esto es, mapear el esquema conceptual a las áreas de almacenamiento y determinar los métodos de acceso a las bases de datos. En el caso de las bases de datos distribuidas se tienen que considerar los dos problemas siguientes:
3. Diseño de la fragmentación, este se determina por la forma en que las relaciones globales se subdividen en fragmentos horizontales, verticales o mixtos.
4. Diseño de la asignación de los fragmentos, esto se determina en la forma en que los fragmentos se mapean a las imágenes físicas, en esta forma, también se determina la solicitud de fragmentos.
Enfoques al problema de diseño
ENFOQUE DE ARRIBA HACIA ABAJO (TOP-DOWN) Este enfoque es más apropiado para aplicaciones nuevas y para sistemas homogéneos. Consiste en partir desde el análisis de requerimientos para definir el diseño conceptual y las vistas de usuario. A partir de ellas se define un esquema conceptual global y los esquemas externos necesarios. Se prosigue con el diseño de la fragmentación de la base de datos, y de aquí se continúa con la localización de los fragmentos en los sitios, creando las imágenes físicas. Esta aproximación se completa ejecutando, en cada sitio, "el diseño físico" de los datos, que se localizan en éste. Se presenta un diagrama con la estructura general del enfoque top-down.
EL DISEÑO DE ABAJO HACIA ARRIBA (BOTTOM-UP) Se utiliza particularmente a partir de bases de datos existentes, generando con esto bases de datos distribuidas. En forma resumida, el diseño bottom-up de una base de datos distribuida requiere de la selección de un modelo de bases de datos común para describir el esquema global de la base de datos. Esto se debe es posible que se utilicen diferentes SMBD. Después se hace la traducción de cada esquema local en el modelo de datos común y finalmente se hace la integración del esquema local en un esquema global común.
Trasparencia
La transparencia tiene como punto central la independencia de datos. Los diferentes niveles de transparencia se pueden organizar en capas. En el segundo nivel se permite la transparencia de replicación de datos. La responsabilidad sobre el manejo de transparencia debe estar compartida tanto por el sistema operativo, el sistema de manejo de bases de datos y el lenguaje de acceso a la base de datos distribuida. El propósito de establecer una arquitectura de un sistema de bases de datos distribuidas es ofrecer un nivel de transparencia adecuado para el manejo de la información. En sistemas de bases de datos distribuidos el propósito fundamental de la transparencia es proporcionar independencia de datos en el ambiente distribuido. Se pueden encontrar diferentes aspectos relacionados con la transparencia. La independencia de datos es la inmunidad de las aplicaciones de usuario a los cambios en la definición y/u organización de los datos y viceversa.
Tipos de trasparencia
1. Independencia lógica de datos. Se refiere a la inmunidad de las aplicaciones de usuario a los cambios en la estructura lógica de la base de datos. Esto permite que un cambio en la definición de un esquema no debe afectar a las aplicaciones de usuario. Por ejemplo, el agregar un nuevo atributo a una relación, la creación de una nueva relación, el reordenamiento lógico de algunos atributos.
2. Independencia física de datos. Se refiere al ocultamiento de los detalles sobre las estructuras de almacenamiento a las aplicaciones de usuario. Esto es, la descripción física de datos puede cambiar sin afectar a las aplicaciones de usuario. Por ejemplo, los datos pueden ser movidos de un disco a otro, o la organización de los datos puede cambiar.
La transparencia al nivel de red se refiere a que los datos en un SBDD se accedan sobre una red de computadoras, sin embargo, las aplicaciones no deben notar su existencia. La transparencia al nivel de red conlleva a dos cosas:
1. Transparencia sobre la localización de datos. Esto es, el comando que se usa es independiente de la ubicación de los datos en la red y del lugar en donde la operación se lleve a cabo. Por ejemplo, en Unix existen dos comandos para hacer una copia de archivo. Cp se utiliza para copias locales y rcp se utiliza para copias remotas. En este caso no existe transparencia sobre la localización.
2. Transparencia sobre el esquema de nombramiento. Lo anterior se logra proporcionando un nombre único a cada objeto en el sistema distribuido. Así, no se debe mezclar la información de la localización con en el nombre de un objeto.
3. La transparencia sobre replicación de datos se refiere a que si existen réplicas de objetos de la base de datos, su existencia debe ser controlada por el sistema no por el usuario. Se debe tener en cuenta que al cuando el usuario se encarga de manejar las réplicas en un sistema, el trabajo de éste es mínimo por lo que se puede obtener una eficiencia mayor. Sin embargo, el usuario puede olvidarse de mantener la consistencia de las réplicas teniendo así datos diferentes.
4. La transparencia a nivel de fragmentación de datos permite que cuando los objetos de la bases de datos están fragmentados, el sistema tiene que manejar la conversión de consultas de usuario definidas sobre relaciones globales a consultas definidas sobre fragmentos. Así también, será necesario mezclar las respuestas a consultas fragmentadas para obtener una sola respuesta a una consulta global. El acceso a una base de datos distribuida debe hacerse en forma transparente.
Fragmentacion
La fragmentación es una característica de servidor de bases de datos que le permite controlar dónde se almacenan los datos a nivel de tabla. La fragmentación le permite definir grupos de filas o claves de índice dentro de una tabla, según algún algoritmo o esquema. Puede almacenar cada grupo o fragmento (también conocido como partición) en un espacio de base de datos (dbspace) independiente asociado con un disco físico específico. Se utilizan sentencias SQL para crear los fragmentos y asignarlos a los espacios de base de datos. El esquema que se utiliza para agrupar filas o claves de índice en fragmentos se denomina esquema de distribución.
El esquema de distribución y el grupo de dbspaces en el que se ubican los fragmentos forman la estrategia de fragmentación.
Considere la posibilidad de fragmentar sus tablas si tiene como objetivo mejorar al menos uno de los aspectos siguientes:
Tiempo de respuesta de un solo usuario
Concurrencia
Disponibilidad
Características de copia de seguridad yrestauración
Carga de datos
Su principal objetivo de fragmentación determina el modo de implantar la estrategia de fragmentación, o al menos influye sobre el mismo. Cuando decida si desea utilizar la fragmentación para conseguir alguno de los objetivos anteriores, recuerde que dicha fragmentación requiere cierta actividad adicional de administración y supervisión.
CONSIDERACIONES DE DISEÑO DE LAS BDD
El problema de diseño de bases de datos distribuidos se refiere, en general, a hacer decisiones acerca de la ubicación de datos y programas a través de los diferentes sitios de una red de computadoras. La decisión de donde colocar a las aplicaciones tiene que ver tanto con el software del SMBDD como con las aplicaciones que se van a ejecutar sobre la base de datos.
Los ambientes en los que se encuentra con mayor frecuencia el uso de las BDD son: Cualquier organización que tiene una estructura descentralizada Caso típico a lo anterior: organismos gubernamentales y/o de servicio públic0 La industria de la manufactura (aquella con plantas múltiples) Aplicaciones de control y comando militar ARQUITECTURA DE BDD La arquitectura define la estructura de un sistema. Al definir la arquitectura se deben identificar las componentes de un sistema, las funciones que realiza cada una de las componentes y las interrelaciones e interacciones entre cada componente. Modelo ANSI/SPARC El objetivo principal de esta arquitectura es definir un SGBD con el máximo grado de independencia, separando las aplicaciones de usuario y la base de datos física. Podemos...
SISTEMAS DE BASES DE DATOS DISTRIBUIDOS HOMOGÉNEOS Y HETEROGÉNEOS Base de Datos Homogéneas Los sistemas de datos homogéneos le aparecen al usuario como un solo sistema y son mucho más fáciles de diseñar y administrar. Para que un sistema de datos distribuido sea homogéneo, la estructura de datos deben ser idénticas o compatible o compatible en cada ubicación. La aplicación de base de datos utilizada en cada ubicación también debe ser idéntica o compatible. En una base de datos homogénea , todos los sitios almacenan los datos de forma idéntica. Base de Datos Heterogénea Es una base de datos distribuida heterogénea, el hardware, los sistemas operativos o las aplicaciones de la base de datos pueden ser diferentes en cada ubicación. Los diferentes sitios pueden utilizar diferentes modelos de datos y software. una diferencia en el modelos de datos puede dificultar el procesamiento de consultas. Esto puede provocar problemas en el procedimiento de transacciones. ...
ARQUITECTURA DE LAS BASES DE DATOS DISTRUBUIDAS las primeras bases de datos centralizadas, ha habido una evolución hacia la descentralización, paralela al desarrollo de redes informáticas, dando lugar a arquitecturas como cliente-servidor, bases de datos paralelas, y bases de datos distribuidas Sistema Gestor de Base de Datos Distribuido Se considera un SGBDD (sistema gestor de base de datos distribuido) a un “sistema software que permite gestionar la base de datos distribuida y hace que dicha distribución sea transparente para los usuarios” Un SGBDD se compone de una única base de datos lógica, que físicamente está dividida en fragmentos ubicados en nodos distintos e interconectados mediante una red de comunicaciones. También conviene entender la diferencia entre SGBD distribuido y SGBD paralelo definido como “un SGBD que se ejecuta sobre múltiples procesadores y utilizando múltiples discos y que está diseñad...
Comentarios
Publicar un comentario