Monday, September 04, 2006

UNIDAD 1 "SISTEMAS DISTRIBUIDOS TOLERANTES A FALLAS

Antes de comenzar con los sistemas distribuidos tolerantes a fallos debemos definir lo que es un sistema distribuido.

Un sistema distribuido se ha definido como una colección de computadores con cierta autonomía el cual están conectados por medio de una red, y con el software distribuido que esta mas adecuado para que el sistema sea visto por los usuarios como una única entidad capaz de proporcionar facilidades de computación.

Esta tendencia se ha acelerado por el desarrollo de software para sistemas distribuidos, diseñado para soportar el desarrollo de aplicaciones distribuidas. Este software permite a los ordenadores coordinar sus actividades y compartir los recursos del sistema - hardware, software y datos.
Cual sistema informático puede presentar fallas.Cuando se producen fallas en el hardware o en el software, los programas podrían producir resultados incorrectos o podrían pararse antes de terminar la computación que estaban realizando.
El diseño de sistemas tolerantes a fallos se basa en dos cuestiones, complementarias entre sí: Redundancia hardware (uso de componentes redundantes) y recuperación del software (diseño de programas que sean capaces de recuperarse de los fallos)

Podemos poner un claro ejemplo como es el de un sistema de ordenamiento distribuido de los productos de un supermercado, si la falla se produce podría ocasionar que falten productos en la tienda.
En otros casos, como en el sistema distribuido de un control de tráfico aéreo, podría ser catastrófico.

En los sistemas distribuidos la redundancia puede plantearse en un grano mas fino que el hardware, pueden replicarse los servidores individuales que son esenciales para la operación continuada de aplicaciones críticas.
La recuperación del software tiene relación con el diseño de software que sea capaz de recuperar (roll-back) el estado de los datos permanentes antes de que se produjera el fallo.


1.1 CLASIFICACION Y PROPIEDADES DE FALLAS EN SISTEMAS DISTRIBUIDOS

Clases de Fallas
Ningún sistema puede hacerse para que resista todas las fallas posibles, de modo que es esencial que las fallas se consideren a través del proceso de definición de los requisitos y diseño del sistema. Sin embargo, no es práctico enumerar todas las fallas a ser toleradas; las fallas deben agruparse en clases de fallas manejables.

Las fallas pueden clasificarse basadas en la localidad (componente atómico, componente compuesto, sistema, operador, entorno), en efecto (tiempo, datos) o en causa (diseño, daño). Otros criterios posibles de clasificación incluyen duración (transitorias, persistentes) y efecto sobre el estado del sistema (ruptura, amnesia, amnesia parcial, etc.).

Ya que la ubicación de una falla es tan importante, este criterio es un punto de partida lógico al clasificar fallas.
Localidad
Fallas de Componentes Atómicos
Una falla de componentes atómicos es una falla en el piso de fallas, esto es, un componente que no puede dividirse para propósitos de análisis.

En un sistema de computación, las fallas de substratos pueden aparecer en diversas formas. Por ejemplo, una falla en un bit de memoria no es una falla atómica si los detalles de la memoria están fuera del alcance de interés. Una falla así, podría o no aparecer como una falla de memoria, dependiendo de la habilidad de la memoria para enmascarar las fallas de bits.
Fallas de Componentes Compuestos
La falla de un componente compuesto es aquella que aparece dentro de un conjunto de componentes atómicos mas que en un componente atómico. Puede ser el resultado de una o más fallas de componentes atómicos. La avería de una unidad de disco en un sistema de computación es un ejemplo de avería de componente compuesto.
Fallas a Nivel de Sistema
Una falla a nivel de sistema es aquella que aparece en la estructura de un sistema más que en sus componentes. Tales fallas generalmente son interacción o integración de fallas, es decir, ocurren debido a la forma en que el sistema está armado mas que por la integridad de cualquier componente individual. Tener presente que la inconsistencia en las reglas operativas de un sistema pueden conducir una falla a nivel de sistema. Estas fallas también incluyen fallas de operador, en las cuales un operador no realiza correctamente su rol en la operación del sistema. Los sistemas que distribuyen objetos o información son propensos a una clase especial de falla de sistema: fallas de réplicas. Las fallas de réplicas suceden cuando la información replicada en un sistema se vuelve inconsistente, tanto porque las réplicas que se suponen que proveen resultados idénticos ya no lo hacen o, porque los conjuntos de datos de distintas réplicas no son consistentes con las especificaciones del sistema.
Consideremos los sistemas de computación en un automóvil. Supongamos que la computadora para expansión del airbag y la computadora de frenos antibloqueo se sabe que funcionan bien y aún así fallan porque una interfiere con la otra cuando ambas están presentes.
Fallas Externas
Las fallas externas aparecen desde fuera de los límites del sistema, el entorno, o el usuario. Las fallas ambientales incluyen fenómenos que afectan directamente la operación del sistema, tales como temperatura, vibración o radiación electromagnética o que afectan las entradas que provistas al sistema.
Las fallas también pueden clasificarse de acuerdo a sus efectos sobre el usuario o servicio del sistema.

Ya que los componentes del sistema de computación interactuan intercambiando datos en un determinado tiempo y/o secuencia, los efectos de las fallas pueden separarse claramente en fallas temporales y fallas de valores. Las fallas temporales ocurren cuando un valor se envía antes o después del momento especificado. Las fallas de valores ocurren cuando los datos difieren en valor de la especificación.
Fallas de Valores
Los sistemas de computación se comunican proveyéndose valores. Una falla de valor ocurre cuando un cómputo devuelve un valor que no cumple la especificación del sistema. Las fallas de valores se detectan generalmente usando el conocimiento de los valores permitidos para los datos, determinados posiblemente en tiempo de ejecución.
Fallas Temporales
Una falla temporal ocurre cuando un proceso o servicio no se presta o completa dentro del intervalo de tiempo especificado. Una falla temporal no ocurre si no hay especificación explícita o implícita de una meta. Las fallas temporales se pueden detectar observando el momento en el cual acontece una interacción requerida; generalmente no se necesitan conocer los datos involucrados.
Duración

1.2 ELEMENTOS DE LAS ESTRATEGIAS TOLERANTES A FALLAS
Qué es una falla? Es un error, causado quizás por un problema de diseño, construcción, programación, un daño físico, uso, condiciones ambientales adversas o un error humano. De este modo, las fallas pueden aparecer tanto en el hardware como en el software. La falla de un componente del sistema no conduce directamente a la falla del sistema, pero puede ser el comienzo de una serie de fallas que quizás sí terminen con la falla del sistema.

Un sistema diseñado para corregir una falla puede o no ejecutar funciones específicas, sin embargo, puede seguir acciones para recuperación.


Estrategia tolerante a fallas
Redundancia
El método general para la tolerancia de fallas es el uso de redundancia. Hay tres tipos posibles de redundancia:
De información podemos agregar código de Hamming para transmitir los datos y recuperarse del ruido en la línea por ejemplo. También en sistemas distribuidos, surge la replicación de datos. Esto trae aparejado varios problemas, ya que administrar los datos replicados no es fácil, las soluciones simplistas no funcionan, y hay que pagar un precio por el acceso y disponibilidad de los datos. No vamos a ahondar en este tema, que es complejo y representa un caso de estudio en sí mismo
Del tiempo aquí se realiza una acción, y de ser necesario, se vuelve a realizar. Es de particular utilidad cuando las fallas son transitorias o intermitentes.
Física se agrega equipo adicional para permitir que el sistema tolere la pérdida o mal funcionamiento de algunos componentes.

Esto da lugar a dos formas de organizar los equipos redundantes: la activa y el respaldo primario. Para el primer caso, todos los equipos funcionan en paralelo para ocultar la falla de alguno(s) de ellos. Por su parte, el otro esquema utiliza el equipo redundante de respaldo, sólo cuando el equipo principal falla.
La vida real nos da ejemplos concretos de réplica activa para tolerar fallas mediante redundancia física. Los mamíferos tienen dos oídos, dos pulmones, dos riñones, etc.; en aeronáutica aviones con cuatro motores pueden volar con tres; deportes con varios árbitros, por si alguno omite un evento. Sin embargo, este esquema trae aparejada la necesidad de establecer protocolos de votación. Supongamos (para llevarlo al terreno de STR) tres sensores de presión. Si dos o tres de los valores sensados son iguales, el valor usado es esa entrada. Aparecen problemas si los tres valores son distintos. Hay dos enfoques a la hora de construir protocolos de votación: optimistas y pesimistas. También habrá que considerar que pasa si falla el algoritmo encargado de administrar la votación.
La réplica de respaldo también se manifiesta en el mundo real: el gobierno con el vicepresidente; la aviación, con el copiloto; los automóviles, con las ruedas de auxilio. Este esquema aparece como una solución más sencilla pues no hay necesidad de votación, y además se requieren menos equipos redundantes (en el caso más simple, un primario y un respaldo). Pero tiene la desventaja de trabajar mal ante fallas bizantinas puesto que el primario no da señales claras de fallar.
Para cualesquiera de los métodos a emplear se deben considerar:
· el grado de replicación a usar
· el desempeño en el caso promedio y el peor caso, en ausencia de fallas
· el desempeño en el caso promedio y el peor caso, en presencia de fallas

1.3 RECUPERACION DE ERRORES


Empezaremos por mencionar algo sobresaliente y característica principal que destaca a los sistemas operativos de multiprocesadores la cual es la capacidad de soportar fallas en el hardware de manera individual y al mismo tiempo seguir trabajando.
Aspectos incluidos en la técnica de recuperación de errores son:
La información propia del sistema como del usuario debe estar en múltiples copias y de una manera distribuida para una mayor optimización y buen funcionamiento del sistema.
El Sistema Operativo al funcionar de una manera optimizada se ejecutara con la efectividad de la configuración máxima para una mayor seguridad y por lo tanto cuenta con un subconjuntos ante fallas.
Proporciona la capacidad de detección y corrección de errores del hardware sin interferir con la eficiente capacidad operacional del sistema.
El procesador realiza una revision minuciosa con la finalidad de correrir posibles fallos antes de que se produscan.
El Sistema Operativo tiene la capacidad de dirigir un procesador para controlar un proceso que se este ejecutado en un procesador que falle.


38 Comments:

At 3:00 PM, Blogger BUSCADOR DE SOLUCIONES... said...

hablas de las aplicaciones distribuidas pero viera estado bien que mencionaran alguna de ellas y el ejemplo que menciona de la tienda estaria mejor que lo detallaran para que sea mas claro de entender y les falto ejemplos de redundancia atte manuel alejandro martinez castellanos maalneu@hotmail.com

 
At 3:22 PM, Blogger israel said...

LA DEFINICION DE FALLAS NO ES COMPLETA AL NO ASEGURAR EL SIGNIFICADO POR LO CUAL SE PUEDE CONFUNDIR CON OTRO SIGINIFICADO Y HACEN FALTAS EJEMPLOS DE CLASES DE FALLAS ATT REYNA ENITH HDZ HDZ

 
At 3:32 PM, Blogger AngelBenitez said...

Las fallas son un problema muy comun en la vida real y se presntan en cualquier instante de tiempo. Ademas de los ejemplos que comentas, quisiera comentarte a que tipo de fallas me he enfrentado y la forma en que las he solucionado.

1.-En algunas ocasiones se me han dañado los dispositivos de almacenamiento externo que utilizo para trabajar y esto me ha provocado tener que realizar el trabajo de manera doble, entonces la manera en que he aprendido a combatir este problema es grabando la informacion en varios de estos dispositivos externos (disquetes)y es a lo que estamos llamando respaldo primario.

2.- Tambien me he enfrentado a las fallas ambientales pues en dos ocasiones me ha ocurrido que estoy trabajando y empieza a llover con tormenta elcetrica lo cual ha provocado que se vaya la luz y mi equipo de computo se apague. Afortunadamente la luz no ha tardado en llegar y mi equipo se ha reiniciado y de esta manera he podido recuperar la informacion capturada.

Estas son las fallas que me han ocurrido con mayor frecuencia y al estudiar tu tema he logrado comprender dentro de que clasificacion se encuentran.

Atte: Angel Omar Sosa Benitez

 
At 4:10 PM, Blogger MIGUEL said...

This comment has been removed by a blog administrator.

 
At 4:12 PM, Blogger MIGUEL said...

tu informacion es realmente buena,hoy en dia creo que las fallas en los sistemas son comunes ya que al realizar los sistemas no se toman en cuanta muchas cosas a futuro lo peor es que por un minimo error a nosotros nos provoca un gran problema, como tu mencionas varios ejemplos de fallas que me parecen muy familiares, un ejemplo que talvez yo pueda dar, es con los sistemas operativos como windows tiene fallas; es por eso que no puedes trabajar con diferentes aplicaciones ya avanzadas y el mismo windows te pide que envies errores para poder recuperar errores y poder solucionarlos.
(compañero en la informacion que lei, tienes algunos pequeños conceptos que creo que son de gran importancia que resaltes y separes para poder apreciarlos mejor ya que estan muy pegados con el texto por ejemplo componente atomico, componente compuesto fallas a nivel de sistemas etc. tambien podrias aclarar que es rooll-back?)
por mi parte es todo
att: Miguel Angel Reyes Cruz

 
At 4:15 PM, Blogger Fallas en Distribuidos said...

This comment has been removed by a blog administrator.

 
At 4:15 PM, Blogger Fallas en Distribuidos said...

This comment has been removed by a blog administrator.

 
At 4:15 PM, Blogger Fallas en Distribuidos said...

This comment has been removed by a blog administrator.

 
At 4:38 PM, Blogger Fallas en Distribuidos said...

hola estube checando tu informacion y me di cuenta de varios aspectos importantes que a mi se me habian pasado de desapercibidos, como por ejemplo yo no sabia que el diseño de sistemas tolerantes a fallas se basa en la redundancia de hardware y en la recuperacion de software y que ambas se complementan entre si para formar en si el sistema distribuido, con respecto a redundancia de hardware yo lo asocio con este ejemplo de que yo estoy tabajando en una BD de un sistema distribuido, pero me encuentro en alamo, yo estoy trabajando con un equipo completo, es decir yo tengo mi monitor, mi teclado, CPU y todo lo que necesite para poder trabajar en ese sistema distribuido, y otra persona esta en cerro azul trabajando en ese mismo sistema y ambos tenemos todo nuestro hardware necesario para poder trabajar en él, a eso yo entiendo que se le llama redundancia de hardware, y con respecto a la replica de software es que en cada una de esas maquinas se tiene la informacion completa (como un respaldo)en caso de que se me presente alguna falla en mi equipo la informacion no la pierdo porque se encuentra disponibles en las demas estaciones de trabajo.(si estoy mal por favore haganmelo saber).
yo habia escuchado de las falla en los sistemas distribuidos, pero no sabia que la calsificacion que yto tengo de ellas esta incluida dentro de otra clasificacion, como por ejemplo la falla de amnesia ( yo sabia que era un tipo de falla)esta clasificada dentro de fallas de efecto sobre el estado del sistema., eso es algo que tomare en cuenta para hacer la clasificacion de las fallas, y con respecto al ultimo tema hacen mencion de los aspectos incluidos en la tecnica de recuperacion de errores pero no especificas a que tipo de tecnica te refieres si a la de recuperacion ahcia adelante o hacia atrás.
eso es todo con respecto a mis comentarios espero y les sirvan de algo.

atte: Mayra Ruth Olvera Rojas (representante del equipo de FALLAS EN DISTRIBUIDOS)

 
At 4:48 PM, Blogger Fallas en Distribuidos said...

This comment has been removed by a blog administrator.

 
At 4:49 PM, Blogger Fallas en Distribuidos said...

como se avia es considerable el progreso de la arquitectura de los sistemas de computo basado en la gran cantidad de arquitecturas de alta velocidad y satisfacción de las aplicaciones distribuidos y Multiprocesadores dentro de una red las cuales se mencionan las clasificaciones de las diferentes tipos de fallas y recuperaciones que no se especifican como:
los procesos de sistema,amnesia,pausa y de comunicacion.
y Los fallos pueden ser:
Dependiendo de su duracion
Transitorios
Permanentes
las redes
los discos
Dependiendo de su causa
De diseÑo
De operacion
el software.
para su recopilacion de informacion consultar estas paginas


http://gsyc.escet.urjc.es/docencia/asignaturas/csc/transpas/2SDTF.pdf#search=%22clasificacion%2C%20tolerantes%20a%20fallos%20en%20sistemas%20distribuidos%22

http://manuales.astalaweb.com/Manuales/Sistemas%20operativos.asp

atte

ezequiel del angel

 
At 4:51 PM, Blogger Fallas en Distribuidos said...

Este tipo de fallas que mencionas como la ambiental tiene gran importancia ya que las maquinas al estar trabajando adquieren un calentamiento y por lo tanto debe estar a temperatura estable para que no ocasione un sobrecalentamiento, y asi al estar procesando infgormacion lo haga de manera mas eficiente. al hablar de fallas temporales mencionas que es cuando no se completa el proceso en un tiempo dado pero como habiamos visto en otras materias ese proceso incompleto tiene que esperar a que los otro proceso termine y asi continuar con el para que termine, es como un ciclo entre procesos. lo que son los sistemas operativos multiprocesadores siento que asi deberian ser todos los demas sistemas operativos por que hay veces que si falla el sistema todo se paraliza y aunque queramos seguir trabajando ya no podemos hacer nada hasta arreglar el problema.

esta muy bien su informacion

ATTE.

JOEL NICOLAS CRUZ

 
At 4:54 PM, Blogger Fallas en Distribuidos said...

HOLA CHAVOS, ESTUBE VIENDO SU INFORMACION Y OBSERVE QUE EN LA CLASIFICACION DE LAS FALLAS, USTEDES SOLO HACEN MENSION DE LAS FALLAS DEL SISTEMA, LAS CUALES SON FALLA DE AMNESIA, FALLAS DE AMNESIA PARCIAL, FALLAS DE PAUSA, FALLAS DE ABORTO, ETC., CREO QUE SERIA MEJOR QUE DIERAN UNA BREVE EXPLICACION DE ELLAS PARA ENRIQUECER MAS SU INFORMACION. ENCONTRE UNA PAGINA DONDE HABLAS ACERCA DE ELLO. LA PAGINA ES: http://www.itistmo.edu.mx/Pag%20Informatica/APUNTES_archivos/page0002.htm , CREO QUE SERIA DE BUENA UTILIDAD ESTA PAGINA SOLO PARA COMPLEMENTAR. SUERTE!!!

ATTE: RICARDO SAN ROMAN

 
At 4:59 PM, Blogger LUIS AGUILLON said...

HOLA:

CREO QUE COINCIDIMOS EN QUE LA REDUNDANCIA ES UNO DE LOS METODOS MAS USUALES DE LAS ESTRATEGIAS TOLERANTES A FALLAS.....PUES BIEN TU MENCIONAS ALGUNAS COMO EL HAMING
Y TROS MAS QUE YO NO CONOCIA, PUES YO ESTABA ENTERADO DE QUE EXISTIAN OTROS 3 METODOS COMO LO SON :

REDUNDANCIA DE LA INFORMACION
REDUNDANCIA DEL TIEMPO
REDUNDANCIA FISICA

SIN EMBARGO ES BUENO, VER QUE EXISTEN MAS METODOS, AUNQUE CREO QUE LA REDUNDANCIA DE LA INFORMACION QUE YO MENCIONO ES IGUAL O PARECIDA A LA QUE TU MENCIONAS COMO HAMING.....

PERO EN SI, TU PUEDES DECIR LE QUE SIGNIFICA REDUNDANCIA???....CREO QUE ES UN CONCEPTO QUE DEBEMOS ANALIZAR MUY AFONDO, PARA QUE QUEDE MAS CLARO....SALUDOS

 
At 5:20 PM, Blogger FAILED SYSTEM said...

holas, se me hozo bastante ingenioso de su parte poner el ejemplo de una computadora comparandola copn un carro para explicar los errores de replica se la sacaron ahh, pero en fin me parecio que su informacion es bastabnte buena aunke en algunas partes me confundi ya que algunos puntos estaban mesclados entre si creo que estaban explicando las fallas pero en fin esta muy bien su blog by
att. orlando garcia valdez

 
At 5:39 PM, Blogger Ivan de Jesus said...

su investigacion esta muy bien redactada, su trabajo me parece completo y entendible, me agrado mucho que le hallan agregado la definicion de un sistema distribuido y algunos ejemplos, pero estaría aun mejor si extienden sobre el tema de: Fallas de Componentes Atómicos y si le hubieran agragado el origen y la evolucion de los sistemas distribuidos

En nuestro nivel no es tan necesario, pero si complementario, el uso de imágenes a fin de realizar representaciones o mostrar algunos ejemplos sobre los temas mencionados, por tanto si puedes agregar algunas imágenes se los agradecería.

 
At 6:24 PM, Blogger BUSCADOR DE SOLUCIONES... said...

saben una forma de solucionar errores en my punto de bista es el respaldar la info con una central espejo de forma q toda la info se respalde automaticamente en todos los puntos esto elevaria costos pero les aseguro q aumentaria la seguridad respecto a la seguridad :

comento: rodrigo flores ruiz

 
At 6:27 PM, Blogger BUSCADOR DE SOLUCIONES... said...

saben yo creop q la solucion ala gran mayoria de los errores en este tipo de redes es responsabilidad de el hardware bueno yo creo q si se creara el aparato q se manejar sin posibilidad de q se desconecte o deje de trabajar por falta de energia electrica seria la solucion

atte:

rosa laget

 
At 6:30 PM, Blogger aby said...

Hola chicos!!!! bueno yo entiendo por el concepto de "Sistemas Distribuidos" que se ha popularizado tanto en la actualidad y que tiene como ámbito de estudio las redes como por ejemplo: Internet, redes de teléfonos móviles, redes corporativas, redes de empresas, etc.
en general esta muy completo su blogg :d creo que este pequeño espacio nos sera de mucha utilidad....
gracias por su gran aportacion...
atte: ABIGAIL MALDONADO P.

 
At 7:08 PM, Blogger BUSCADOR DE SOLUCIONES... said...

atte arturo cristerna pues estuve checando su informacion y la verdad estos tipos de fallas pueden ocurrir en cualquier momento y la verdad uno debe estar preparado para esos tipos de fallas y tratar de recuperar la informacion

 
At 7:50 PM, Blogger ANALISIS DE FALLAS EN SISTEMAS DISTRIBUIDOS said...

hola creo que en tu blog te falto hablar un poco mas sobre la PREVENCION DE ERRRORES Y SU TOLERANCIA:aque te explico un poco de lo que sig. esto:
La prevencion de fallos utiliza metodos para impedir que se presenten fallos en los componentes.
Estos metodos pueden ser: de diseño, de test y de validacion.
La experiencia demuestra que, a pesar de la prevencion, se presentan fallos durante el
funcionamiento de los sistemas
Necesitamos tolerancia a fallos
La tolerancia a fallos usa la redundancia para enmascarar fallos.
Si un componente falla, se usa uno redundante que evita la disfuncion del sistema
La prevencion y la tolerancia son complementarias.
Un sistema es tolerante a fallos si puede enmascarar fallos de sus componentes usando
redundancia
Una tecnica de tolerancia a fallos se caracteriza por conservar la funcionalidad del sistema
dentro de un modelo de fallos particular
Las partes redundantes de un sistema son aquellas no necesarias cuando no se producen
fallos
La redundancia de un sistema puede ser:
Hardware
Software
Espacial o estatica
Temporal o dinamica.

creo que esto es importante saberlo ya que en mi caso yo no sabia a que se debia por lo que te invito a que lo puedas utilizar de retroalimentacion en tu blog.

atte:brenda contreras beltran

 
At 8:22 PM, Blogger ANALISIS DE FALLAS EN SISTEMAS DISTRIBUIDOS said...

LA VERDAD, NO ENTENDI BIEN LAS CLASES DE FALLAS, COMO QUE LOS CONCEPTOS SON MUY GENERALES, Y NO TIENEN EJEMPLOS, (FALLAS DE COMPONENTES ATOMICOS, COMPUESTOS, A LA VELOCIDAD DEL SISTEMA, O ALGO ASI, JEJE). LA CUESTION ES QUE TENGO DUDA EN ESO.

DENNIS

 
At 8:23 PM, Blogger ANALISIS DE FALLAS EN SISTEMAS DISTRIBUIDOS said...

LA VERDAD, NO ENTENDI BIEN LAS CLASES DE FALLAS, COMO QUE LOS CONCEPTOS SON MUY GENERALES, Y NO TIENEN EJEMPLOS, (FALLAS DE COMPONENTES ATOMICOS, COMPUESTOS, A LA VELOCIDAD DEL SISTEMA, O ALGO ASI, JEJE). LA CUESTION ES QUE TENGO DUDA EN ESO.

DENNIS

 
At 8:50 PM, Blogger FAILED SYSTEM said...

ESTOY EN ACUERDO CON DENNIS YA QUE NO ESPECIFICAN CUALES SON LOS TIPOS DE FALLAS, PERO LO QUE MAS ME LLAMO LA ATENCION ES SOBRE ESTE PUNTO. Las fallas externas aparecen desde fuera de los límites del sistema, el entorno, o el usuario. Las fallas ambientales incluyen fenómenos que afectan directamente la operación del sistema, tales como temperatura, vibración o radiación electromagnética o que afectan las entradas que provistas al sistema.

SI MAL RECORDAMOS EN LA MATERIA DE REDES 2, SE TUVO QUE VER ALGO SOBRE LA IMPLEMENTACION Y DISEÑO DE UNA RED... SE QUE NO ES EL CASO ESTE PERO UNO COMO INGENIERO EN SISTEMAS DEBE DE PREVENIR ESTE TIPO DE ERRORES... CUIDA EL TIPO DE CABLEADO QUE SE UTILIZARA, Y COSAS ASI. ASI QUE TOY UN POKITO EN DESACUERDO EN ELLO.

 
At 8:55 PM, Blogger FAILED SYSTEM said...

EL COMENTARIO ANTERIOR ES DE ERICK GONZALEZ. JEJE SE ME OLVIDO ESPECIFICAR. POR LAS CARRERAS.

 
At 8:57 PM, Blogger ANALISIS DE FALLAS EN SISTEMAS DISTRIBUIDOS said...

HOLA: A PESAR DE QUE ME PARECE QUE TU CLASIFICACION HACERCA DE LOS SISTEMAS TOLERANTES A FALLAS,OPINO QUE ES UN TANTO DIVERSA Y POR TAL MOTIVA HASTA CONFUSA..TE RECOMENDARIA QUE CLASIFICARAS DE ACUERDO A LOS SIGUIENTES PUNTOS, QUE LLEVARIAS A UN MEJOR ENTENDIMIENTO:
**LOCALIDAD
FALLAS **EFECTO
**DURACION
EN DONDE HACES REFERNCIA A LA RECUPERACION DE SW TAN SOLO EXPLICAS ESTE PUNTO, Y OLVIDAS MARCAR QUE LAS CUESTIONES BASICAS TOMADAS EN CUENTA PARA LOS SISTEMAS TOLERANTES A FALLAS SON DOS: **REDUNDANCIA DE HW
**RECUPERACION DE SW

GRACIAS ATTE ¨¨YARACEDH LARA CASTRO¨¨

 
At 9:09 PM, Blogger israel said...

bueno creo que sigo diciendo lo mismo como este es mi iltimo blog visitado quiero referirme otravez a que me intereso la manera de como corregir las fallas en los sistemas distribuidos asi que fue en los qu mas me fije en los tipos de fallas y en la manera de corregirlos debido a que podremos aplicarlos proximamente en nustras practicas espero que nos haya servido de mucho esta informacion a todo el grupo por que en lo personal si me gusto y su informacion la vi muy completa tomando en cuenta los puntos que ya mencione.
ATTE:
ISRAEL ANTONIO

 
At 9:17 PM, Blogger ANALISIS DE FALLAS EN SISTEMAS DISTRIBUIDOS said...

This comment has been removed by a blog administrator.

 
At 9:18 PM, Blogger ANALISIS DE FALLAS EN SISTEMAS DISTRIBUIDOS said...

BUENO PUES TU INFORMACION ESTA MUY COMPLETA Y ENTENDIBLE PERO HAI TE VA UNA CONTRIBUCION HACERCA DE LO DE TOLERA´NCIA A FALLOS para la tolerancia a fallos como en todo hay faces las cuales son:

1. deteccion de errores:aqui se detectan los errores mediante chequeos como en todo.

2. confinamiento del daño:desde que ocurre el error hasta que se sdetecta pasa untiempo en este tiempo el error pudo aumentar, como un virus s e expande rapidamente si no es bloqueado a tiempo

3.recuperacion de erroeres. cuando se pasa a un estado consistente osea cuando el sisrtema queda estable

4. tratamiento del fallo. si el error es perm,anente solo son arecuperacion de errores no es suficiente se requiere de iun tratamiento de fallos el cual se divide en otro 2

localizacion del fallo
y finalmente reparacion del sistema

att. oscar soni gallardo
osonig

 
At 9:41 PM, Blogger oralia said...

HOLA:
concuerdo con la informacón de su blogg, cuando nos dicen que ningun sistema distribuido pude hacer que se resistan a todas las fallas posibles; pero si opino que se puede hacer un sistema que trate de solucionar la mayoria de las fallas, ya que esto nos hace los sistemas mas seguro, para nuestra comodidad, evitandono problemas críticos y en algunos casos accidentes.

ATTE. CARMEN ORALIA BAUTISTA MORALES

 
At 9:50 PM, Blogger viry said...

BUENO LA VERDAD CREO QUE TE HIZO FALTA MAS INFORMACION ACERCA DE RECUPERACION DE FALLAS ..

EXISTEN TECNICAS EN LA RECUPERACION DEERRORES COMO SON :

*RECUPERACION DE ERRORES HACIA ADELANTE... BUENO EN ESTA NOS DICE QUE A PESAR QUE EXISTEN DAÑOS CAUSADOS POR LAS FALLAS LA OPERACION PUEDE CONTINUAR Y ACCESAR CON GRAN SEGURIDAD...

OTRA ES

*RECUPERACION DE ERRORES HACIA ATRAS... NOS DICE QUE
NO SE PUEDEN DETECTAR LOS ERRORES QUE PUEDEN OCURRIR Y POR LO TANTO NO SE PUEDEN ELIMINAR

BUENO ESPERO TOMES EN CUENTA MI APORTACION ...

 
At 10:06 PM, Blogger Nallely said...

HOLA COMPAÑEROS:
SE DICE QUE EL PUNTO DE PARTIDA PARA PODER TRATAR UNA FALLA ES LOCALIZAR EL LUGAR DONDE ESTA SURGE
MUY CIERTO ANTES DE QUERER SOLUCIONAR EL PROBLEMA NO?SABER DONDE SURGIO Y POR QUE
EN SU INFORMACION HABLAN DE FALLAS AMBIENTALES LAS CUALES A MI ENTENDER SEGUN LA INFORMACION SON AQUELLAS QUE TOMAN EN CUENTA ASPECTOS EXTERNOS DEL SISTEMA NO TANTO LOS INTERNOS PERO QUE DE IGUAL MODO LO PUEDEN AFECTAR Y LOS CUALES SON LA ELECTROMAGNETICA, EL CALOR, LA TEMPERATURA, ETC
ESTA FALLA ME LLAMO LA ATENCION PUES TODAS LAS DEMAS HABLAN EN CUANTO A PROCESOS EL SISTEMA, ETC, ESTA UTILIZA UN ASPECTO MAS QUE ES EL AMBIENTE.
ATTE: NALLELY HERNANDEZ RAMIREZ

 
At 11:25 PM, Blogger ANALISIS DE FALLAS EN SISTEMAS DISTRIBUIDOS said...

Bueno a mi me gustaria aportarles un tipo de recuperacion de errores en el sistema denominado reasignación de clústeres. Dice que cuando el sistema operativo devuelve un error de sector defectuoso al sistema de archivos NTFS(tipo de particion o formato del disco duro), NTFS reemplaza dinámicamente el clúster de disco que contiene el sector dañado y asigna un nuevo clúster de disco para los datos. Si el error se produce durante una lectura, NTFS devuelve un error de lectura al programa que realiza la llamada y los datos se pierden (a menos que estén protegidos mediante la tolerancia a errores de RAID). Cuando el error se produce durante una operación de escritura, NTFS escribe los datos en el nuevo clúster de disco y no se pierde ningún dato. NTFS incluye la dirección del clúster de disco que contiene el sector defectuoso en su archivo Bad Sector (sector defectuoso), de manera que dicho sector no se vuelva a utilizar.

Espero les sirva esta informacio...

Atte: Enrique Borbolla Palma

 
At 12:59 PM, Blogger Fallas en Distribuidos said...

bueno siento que podrias enriquecer un poco mas tu informacion hablando que adermas de los tipos de fallas podemos encontras la prevencion y tolerancia de fallos en las cuales hay dos formar de aumentar la fiabilidad de un sistema que es la prevencion de fallos y la tolerancia a fallos asi como la prevencion trata de evcitar losd fallos antes de que el sistema entre en funcionamiento ny la tolerancia del sstema continue funcionando aunque se produzcan fallos asi tambien como la prevenvion y la tecnicas de elimancion de fallos se que tal vez aunque en el temario no venga siento que pudieras enriquecerla con estos puntos encontre una pagina que pudiera ser util de algo...

http://cum.unex.es/profes/profes/sasah/STR/Tema08.pdf#search=%22TOLERANCIA%20Y%20RECUPERACION%20DE%20ERRORES%22

atte: claudina morales hernandez

 
At 3:03 PM, Blogger Ivan de Jesus said...

su informacion acerca de los sistemas heterogeneos esta muy completa, me gusto la introduccion que fueron dando, los puntos estan bien detallados, pero a lo unico que no le entendi fueron a los FLECOS, esto con respecto a los sistemas heterogeneos, en cuanto a linex y nt es muy sorprendente saber que tu sistema operativo lo puedas llevar contigo mismo y solo tienes que configurar el BIOS para que arranque desde el cd o desde la memoria usb, el nt como ya sabemos esta orientado a los servidores en red, su informacion esta bien interesante y creo que tendre que cambiar de plataforma de trabajo.

 
At 3:48 PM, Blogger BUSCADOR DE SOLUCIONES... said...

muy buena introduccion de el tema del tema de los sistemas heterogeneos a mi parecer este amuy completo el tema lo de los flecos esta medio raro estaria bien que se comentara en el salon lo de ese parte pero en general muy bien desarrollada esta unidad atte manuel alejandro mertinez castellanos

 
At 6:08 PM, Blogger ANALISIS DE FALLAS EN SISTEMAS DISTRIBUIDOS said...

ME GUSTO LA ESTRUCTURA DE LA INFORMACION Y QUE QUE ES CONCRETA ( 2.1, 2.1, 2.3)ADEMAS ME LLAMO LA ATENCION, LO QUE PUBLICARON ACERCA DE DONDE SE ASPLICA LA HETEREGENEIDAD:
– Redes (a nivel de protocolos, a nivel físico)
– Hardware de computadores
– Sistemas Operativos (Unix, Windows,...)
– Lenguajes de Programación
– Implementación de diferentes desarrolladores
ME HUBIERA GUSTADO DESGLOSARAN ESTOS PUNTOS.
ATTE
DENNIS NIETO MARQUEZ

 
At 2:39 AM, Blogger ANALISIS DE FALLAS EN SISTEMAS DISTRIBUIDOS said...

HOLA: Concluyodespues de haber leido este articulo y al ver en la practica como trabaja el stax y a pesar de que cuenta con todas las caracetristicas y recursos de Windows NT, no es un s.o. apropiado para el uso en LapTop, o PC, puesto que no es nada comodo eso de estar instalando cada ves que utilicemos un equipo, en cuanto a la comparacion contra el NT, este facilita la ocupacion de un equipo puesto que solo basta con encender un boton, a pesar de que regresamos al problema de que solo sive para LAN's, por otro lado si hablamos en cuanto a espacio podemos decir que el slax es mejor puesto que solo se instala temporalmente en nuestro equipo, pero!!!, ¿Y despues?, en cuanto a los sistemas heterogeneos, les falto explicar algunos terminos hacerca de la heterogeneidad, claro les recomiento la sig. pag, para agregarle informacion :http://www.itistmo.edu.mx/Pag%20Informatica/APUNTES_archivos/page0003.htm
Atte: Yaracedh Lara Castro

 

Post a Comment

<< Home