Para poder practicar con nuestro Windows Server, lo hemos instalado en una máquina virtual. Pero vamos a pensar en él de la misma forma que si estuviera en un entorno de producción.
Imaginemos ahora que lo tenemos instalado en un servidor físico donde va a proporcionar servicios vitales para nuestra empresa. Aquí debemos pensar ya en qué métodos tenemos a nuestra disposición para poder tener cierta protección en los datos almacenados en los discos.
Veamos un concepto muy importante que debe cumplir obligatoriamente un servidor. Hablaremos ahora del almacenamiento y aquí es donde merece la pena invertir en unos buenos discos o cabina de almacenamiento para proporciona un sistema de almacenamiento fiable. Esta inversión nos va a ofrecer una garantía de funcionamiento, rendimiento y, sobre todo, tolerancia a fallos.
Tipos de discos
Hay tres tipos de discos duros: los IDE (incluye los serial ATA), los SCSI (y su última versión, los SAS) y los de estado sólido o SSD. Los SCSI son especiales y están especialmente mejorados para trabajar con servidores. Aunque veamos ofertas de servidores con discos baratos de tipo IDE (o Serial ATA), estos no están preparados para dar un buen rendimiento en servidores así que debemos cambiar esa configuración para sustituir esos discos por discos SCSI o SSD.
Los discos de estado sólido SSD son la mejor alternativa teniendo buen presupuesto, ya que tienen un precio bastante elevado en su versión para servidor. Sin duda son la opción más rápida y la que más nivel de entradas/salidas (input/outputs) proporcionan en el almacenamiento.
Los discos sólidos SSD siguen bajando de precio. Reemplazarán a los discos duros tradicionales, pero de momento esta tecnología no es barata así que en muchos servidores se instalan discos para el sistema operativo Windows Server en RAID 1 y luego se añaden varios de tipo SAS como almacenamiento masivo más económico.
Comparativa de rendimientos
La importancia de la información
Es evidente que la información es el activo más valioso e importante de cualquier empresa, que los datos han de estar disponibles en todo momento (24 horas x7 días a la semana x365 días al año) y además que debemos estar preparados contra incidencias. El coste de una posible pérdida de información y el tiempo durante el cual el sistema no está en explotación mientras se soluciona el problema, es un lujo que cada vez menos empresas pueden permitirse. Así pues, disponer de un sistema de almacenamiento seguro y tolerante al fallo, como los sistemas RAID, es algo imprescindible
La configuración de estos discos SCSI o SSD, que en muchos servidores vienen ya configurados, la haremos con los sistemas tolerantes a fallos o RAID. Habitualmente los servidores incorporan tarjetas "hardware" que realizan esta construcción de los sistemas RAIS redundantes que veremos a continuación. Pero vamos a realizar unas prácticas con discos en Windows que se comportarán de forma idéntica a la gestionaría estas tarjetas hardware o una cabina de almacenamiento externa.
Resumiendo
Resumiendo, RAID proporciona tolerancia a fallos, mejora el rendimiento del sistema y aumenta la productividad:
Existen dos tipos de tecnología RAID: basada en software y basada en hardware. Cada uno de ellos tiene sus ventajas y sus inconvenientes.
La ventaja de los RAID basados en hardware es su independencia de la plataforma o sistema operativo, ya que son vistos por este como un gran disco duro más, y además son más rápidos. Los sistemas RAID software no son implementaciones adecuadas en la mayoría de los casos, y cada vez son menos empleados.
A diferencia de las matrices (RAID) basadas en software, las que están basadas en hardware utilizan controladores RAID que se conectan a una ranura PCI del servidor. Con tan solo una diferencia mínima de precio con respecto al coste del controlador que se necesita para el software RAID, el hardware RAID ofrece ventajas significativas en lo que respecta a:
No dudamos entonces de que nuestro RAID debe ser por hardware. Si adquirimos el servidor indicando que queremos que tenga un sistema RAID con toda seguridad será por hardware. Prácticamente todos los servidores modernos incorporan en la propia placa el soporte para discos RAID.
La elección de los diferentes niveles de RAID va a depender de las necesidades del usuario en lo que respecta a factores como seguridad, velocidad, capacidad, coste, etc. Cada nivel de RAID ofrece una combinación específica de tolerancia a fallos (redundancia), rendimiento y coste, diseñadas para satisfacer las diferentes necesidades de almacenamiento. La mayoría de los niveles RAID pueden satisfacer de manera efectiva solo uno o dos de estos criterios. No hay un nivel de RAID mejor que otro; cada uno es apropiado para determinadas aplicaciones y entornos informáticos. De hecho, resulta frecuente el uso de varios niveles RAID para distintas aplicaciones del mismo servidor.
Esquema
Sabemos que la tecnología RAID permite hacer matrices de discos de diferentes formas. Compramos un servidor con tarjeta raid y tres discos iguales y ahora decidiré cuál de las configuraciones de la matriz (RAID) es la más aconsejable. Por ejemplo, la más implementada es la de RAID 5 que vemos en este esquema:
Oficialmente existen siete niveles diferentes de RAID (0-6), definidos y aprobados por el RAID Advisory Board (RAB). Además, existen las posibles combinaciones de estos niveles (10, 50...). Los niveles RAID 0, 1, 0+1 y 5 son los más populares.
RAID 0: Disk Striping "La más alta transferencia, pero sin tolerancia a fallos"
También conocido como "separación o fraccionamiento/ Striping". Los datos se desglosan en pequeños segmentos y se distribuyen entre varias unidades. Este nivel de "array" o matriz no ofrece tolerancia a fallos. (Es decir crea una sola unidad con varios discos, pero la información no se replica por lo tanto si se estropea uno perderemos la información. La ventaja es que por hardware creamos una unidad lógica que se compone de varios discos: transparente para nosotros y muy rápida). Al no existir redundancia, RAID 0 no ofrece ninguna protección de los datos. El fallo de cualquier disco de la matriz tendría como resultado la pérdida de los datos y sería necesario restaurarlos desde una copia de seguridad. Por lo tanto, RAID 0 no se ajusta realmente al acrónimo RAID.
Consiste en una serie de unidades de disco conectadas en paralelo que permiten una transferencia simultánea de datos a todos ellos, con lo que se obtiene una gran velocidad en las operaciones de lectura y escritura. La velocidad de transferencia de datos aumenta en relación con el número de discos que forman el conjunto. Esto representa una gran ventaja en operaciones secuenciales con ficheros de gran tamaño. Por lo tanto, este array es aconsejable en aplicaciones de tratamiento de imágenes, audio, vídeo o CAD/CAM, es decir, es una buena solución para cualquier aplicación que necesite un almacenamiento a gran velocidad pero que no requiera tolerancia a fallos. Se necesita un mínimo de dos unidades de disco para implementar una solución RAID 0.
RAID 1: Mirroring "Redundancia. Más rápido que un disco y más seguro"
También llamado "Mirroring" o "Duplicación" (Creación de discos en espejo). Se basa en la utilización de discos adicionales sobre los que se realiza una copia en todo momento de los datos que se están modificando. RAID 1 ofrece una excelente disponibilidad de los datos mediante la redundancia total de los mismos. Para ello, se duplican todos los datos de una unidad o matriz en otra. De esta manera se asegura la integridad de los datos y la tolerancia a fallos, pues en caso de avería, la controladora sigue trabajando con los discos no dañados sin detener el sistema. Los datos se pueden leer desde la unidad o matriz duplicada sin que se produzcan interrupciones.
RAID 1 es una buena solución para las aplicaciones que requieren redundancia cuando hay solo dos unidades disponibles. Los servidores de archivos pequeños son un buen ejemplo. Se necesita un mínimo de dos unidades para implementar una solución RAID 1.
RAID 0+1/ RAID 0/1 o RAID 10: "Ambos mundos"
Combinación de los arrays anteriores que proporciona velocidad y tolerancia al fallo simultáneamente. El nivel de RAID 0+1 fracciona los datos para mejorar el rendimiento, pero también utiliza un conjunto de discos duplicados para conseguir redundancia de datos. Al ser una variedad de RAID híbrida, RAID 0+1 combina las ventajas de rendimiento de RAID 0 con la redundancia que aporta RAID 1. Sin embargo, la principal desventaja es que requiere un mínimo de cuatro unidades y solo dos de ellas se utilizan para el almacenamiento de datos. Las unidades se deben añadir en pares cuando se aumenta la capacidad, lo que multiplica por dos los costes de almacenamiento.
Es decir, creamos una matriz con dos discos utilizando la configuración de RAID 0 que bajo una única unidad podemos incluir varias físicas. Y luego le aplicamos el nivel 1 junto con otros dos discos que tenemos, es decir, hará una copia exacta de esos dos discos en los otros. De todo esto se encarga la tarjeta RAID así sabemos que en todo momento tenemos una copia por si se estropeara algún disco. Lo malo es que siempre hay dos discos "perdidos" ya que forman parte de la copia.
El RAID 0+1 tiene un rendimiento similar al RAID 0 y puede tolerar el fallo de varias unidades de disco. Una configuración RAID 0+1 utiliza un número par de discos (4, 6, 8) creando dos bloques. Cada bloque es una copia exacta del otro, de ahí RAID 1, y dentro de cada bloque la escritura de datos se realiza en modo de bloques alternos, el sistema RAID 0. RAID 0+1 es una excelente solución para cualquier uso que requiera gran rendimiento y tolerancia a fallos, pero no una gran capacidad. Se utiliza normalmente en entornos como servidores de aplicaciones, que permiten a los usuarios acceder a una aplicación en el servidor y almacenar datos en sus discos duros locales, o como los servidores web, que permiten a los usuarios entrar en el sistema para localizar y consultar información. Este nivel de RAID es el más rápido, el más seguro, pero por contra el más costoso de implementar.
RAID 2: "Acceso paralelo con discos especializados. Redundancia a través del código Hamming"
El RAID nivel 2, poco utilizado, adapta la técnica comúnmente usada para detectar y corregir errores en memorias de estado sólido. En un RAID de nivel 2, el código ECC (Error Correction Code) se intercala a través de varios discos a nivel de bit. El método empleado es el Hamming. Puesto que el código Hamming se usa tanto para detección como para corrección de errores (Error Detection and Correction), RAID 2 no hace uso completo de las amplias capacidades de detección de errores contenidas en los discos.
Los que hemos estudiado Informática conocemos esta codificacion donde a través de unos códigos se pueden detectar y corregir errores en la lectura. Las propiedades del código Hamming también restringen las configuraciones posibles de matrices para RAID 2, particularmente el cálculo de paridad de los discos. Por lo tanto, RAID 2 no ha sido apenas implementado en productos comerciales, lo que también es debido a que requiere características especiales en los discos y no usa discos estándares.
Debido a que es esencialmente una tecnología de acceso paralelo, RAID 2 está más indicado para aplicaciones que requieran una alta tasa de transferencia y menos conveniente para aquellas otras que requieran una alta tasa de demanda I/O.
RAID 3: "Acceso síncrono con un disco dedicado a paridad"
Dedica un único disco al almacenamiento de información de paridad. La información de ECC (Error Checking and Correction) se usa para detectar errores. La recuperación de datos se consigue calculando el O exclusivo (XOR) de la información registrada en los otros discos. La operación I/O accede a todos los discos al mismo tiempo, por lo cual el RAID 3 es mejor para sistemas de un solo usuario con aplicaciones que contengan grandes registros.
RAID 3 ofrece altas tasas de transferencia, alta fiabilidad y alta disponibilidad, a un coste intrínsicamente inferior a un Mirroring (RAID 1). Sin embargo, su rendimiento de transacción es pobre porque todos los discos del conjunto operan al unísono.
Se necesita un mínimo de tres unidades para implementar una solución RAID 3.
RAID 4: "Acceso Independiente con un disco dedicado a paridad"
RAID 5: "Acceso independiente con paridad distribuida"
Este array ofrece tolerancia a fallos y, además, optimiza la capacidad del sistema permitiendo una utilización de hasta el 80 % de la capacidad del conjunto de discos. Esto lo consigue mediante el cálculo de información de paridad y su almacenamiento alternativo por bloques en todos los discos del conjunto.
La información del usuario se graba por bloques y de forma alternativa en todos ellos. De esta manera, si cualquiera de las unidades de disco falla, se puede recuperar la información en tiempo real, sobre la marcha, mediante una simple operación de lógica de O exclusivo, sin que el servidor deje de funcionar.
Así pues, para evitar el problema de cuello de botella que plantea el RAID 4 con el disco de comprobación, el RAID 5 no asigna un disco específico a esta misión, sino que asigna un bloque alternativo de cada disco a esta misión de escritura. Al distribuir la función de comprobación entre todos los discos, se disminuye el cuello de botella y con una cantidad suficiente de discos puede llegar a eliminarse completamente, proporcionando una velocidad equivalente a un RAID 0.
RAID 5 es el nivel de RAID más eficaz y el de uso preferente para las aplicaciones de servidor básicas para la empresa. Comparado con otros niveles RAID con tolerancia a fallos, RAID 5 ofrece la mejor relación rendimiento-coste en un entorno con varias unidades. Gracias a la combinación del fraccionamiento de datos y la paridad como método para recuperar los datos en caso de fallo, constituye una solución ideal para los entornos de servidores en los que gran parte del E/S es aleatoria, la protección y disponibilidad de los datos es fundamental y el coste es un factor importante. Este nivel de array es especialmente indicado para trabajar con sistemas operativos multiusuarios. Se necesita un mínimo de tres unidades para implementar una solución RAID 5.
RAID 5 es el nivel más utilizado junto con el RAID 1. Ofrece muy buen rendimiento y solo "desperdiciamos" un disco físico. RAID 1, "desperdicia" el 50 % de los discos físicos ya que es un sistema espejo.
Los niveles 4 y 5 de RAID pueden utilizarse si se disponen de tres o más unidades de disco en la configuración, aunque su resultado óptimo de capacidad se obtiene con siete o más unidades. RAID 5 es la solución más económica por megabyte, que ofrece la mejor relación de precio, rendimiento y disponibilidad para la mayoría de los servidores.
RAID 6: "Acceso independiente con doble paridad"
Similar al RAID 5, pero incluye un segundo esquema de paridad distribuido por los distintos discos y por tanto ofrece tolerancia extremadamente alta a los fallos y a las caídas de disco, ofreciendo dos niveles de redundancia.
Esta píldora formativa está extraída del Curso online de Windows Server 2022.
No pierdas tu oportunidad y ¡continúa aprendiendo!
Política de privacidad
ADR Formación utiliza cookies propias y de terceros para fines analíticos anónimos, guardar las preferencias que selecciones y para el funcionamiento general de la página.
Puedes aceptar todas las cookies pulsando el botón "Aceptar" o configurarlas o rechazar su uso pulsando el botón "Configurar".
Puedes obtener más información y volver a configurar tus preferencias en cualquier momento en la Política de cookies