Clave-valor de par de bases de datos en un entorno de datos grande
Por el momento, la más simple de las bases de datos en un entorno de grandes datos NoSQL (no-sólo-SQL) son las que emplean el modelo par clave-valor (KVP). Bases de datos KVP no requieren un esquema (como RDBMS) y ofrecen una gran flexibilidad y escalabilidad.
Bases de datos KVP no ofrecen ACID (atomicidad, coherencia, aislamiento, durabilidad) capacidad y requieren ejecutores de pensar acerca de la colocación de datos, replicación y tolerancia a fallos que no son controlados expresamente por la propia tecnología. Bases de datos KVP no se escriben. Como resultado, la mayoría de los datos se almacenan como cadenas.
Clave | Valor |
---|---|
Color | Azul |
Libación | Cerveza |
Héroe | Soldado |
Se trata de un conjunto muy simplificada de claves y valores. En una aplicación de datos grande, muchos individuos tienen ideas diferentes sobre colores, libaciones, y los héroes.
Clave | Valor |
---|---|
FacebookUser12345_Color | Rojo |
TwitterUser67890_Color | Pardusco |
FoursquareUser45678_Libation | "Vino blanco" |
Google + User24356_Libation | "Martini seco con un toque" |
LinkedInUser87654_Hero | "El jugador más destacado de ventas" |
Como el número de usuarios aumenta, el seguimiento de las teclas precisas y valores relacionados puede ser un reto. Si necesita hacer un seguimiento de las opiniones de millones de usuarios, el número de pares clave-valor asociado a ellos puede aumentar exponencialmente. Si no desea limitar las opciones de los valores, la representación de cadena genérica de KVP proporciona flexibilidad y facilidad de lectura.
Es posible que tenga algunos datos adicionales en ayuda para organizar una base de datos de claves y valores. La mayoría ofrecen la capacidad de teclas agregados (y sus valores relacionados) en una colección. Las colecciones pueden consistir en cualquier número de pares de valores clave y no requieren el control exclusivo de los elementos KVP individuales.
Una clave-valor base de datos par de código abierto ampliamente utilizado se llama Riak. Se desarrolla con el apoyo de una compañía llamada Basho Technologies y se pone a disposición bajo la licencia Apache Software v2.0.
Riak es una aplicación muy rápida y escalable de una base de datos de claves y valores. Es compatible con un entorno de alto volumen con los datos que cambia rápidamente porque es ligero. Riak es particularmente eficaz para el análisis en tiempo real de la negociación de los servicios financieros. Utiliza "cubos" como un mecanismo de organización para las colecciones de claves y valores.
Implementaciones Riak son grupos de nodos físicos o virtuales situadas en formato de peer-to-peer. No existe un nodo principal, por lo que el clúster es resistente y altamente escalable. Todos los datos y las operaciones se distribuyen en todo el clúster. Focos mayores realizar agrupaciones mejores y más rápidas que con menos nodos. Comunicación en el clúster se implementa a través de un protocolo especial llamado chisme. Chismes almacena información de estado sobre la información de clúster y acciones sobre los cubos.
Riak tiene muchas características y es parte de un ecosistema que consiste en lo siguiente:
- El procesamiento en paralelo: Uso de MapReduce, Riak soporta una capacidad para descomponer y recomponer consultas a través del clúster para el análisis en tiempo real y computación.
- Enlaces y enlace a pie: Riak puede ser construido para imitar una base de datos gráfica usando links. Un enlace puede ser pensado como una conexión unidireccional entre pares clave-valor. Caminar (siguiente) los enlaces proporcionarán un mapa de relaciones entre pares de valores clave.
- Buscar: Buscar Riak tiene una capacidad de búsqueda de texto completo con tolerancia a fallos, distribuida. Cubos pueden ser indexados para la resolución rápida de valor a las teclas.
- Los índices secundarios: Los desarrolladores pueden etiquetar valores con uno o más valores de los campos clave. La aplicación puede consultar el índice y devolver una lista de claves coincidentes. Esto puede ser muy útil en implementaciones grandes datos porque la operación es atómica y apoyará comportamientos en tiempo real.
Implementaciones Riak son los más adecuados para
- Los datos de usuario para las redes sociales, comunidades, o los juegos
- Alto volumen, recopilación de datos a medios ricos y almacenamiento
- Capas de almacenamiento en caché para la conexión RDBMS y bases de datos NoSQL
- Las aplicaciones móviles que requieren flexibilidad y fiabilidad
Artículos relacionados
- Cómo utilizar el Asistente de configuración de base de datos (DBCA) para crear bases de datos en Oracle 12c
- Ahorrar formulario de datos para una base de datos
- Cómo recuperar datos de filas específicas de bases de datos MySQL
- Cómo solucionar problemas con tu base de datos Oracle Registros 12c
- Exploración de la base de datos Consejos de Diseño
- Cómo iniciar un 12c base de datos Oracle
- Administración de red: SQL Server 2008 Creación de base de datos
- La base de datos de seguridad de MySQL
- Fundamentos de la base de datos de Oracle Flashback 12c