Mudanças entre as edições de "Minicluster"

De WikiLICC
Ir para: navegação, pesquisa
m (No break (item não aprovado))
m
 
(119 revisões intermediárias pelo mesmo usuário não estão sendo mostradas)
Linha 1: Linha 1:
== Documentos ==
+
* [[Projeto Minicluster]] LICC enviado a CAPES.
* Dados do [[Projeto Minicluster]] LICC.
+
* [[Minicluster:Hardware]], detalhes das máquinas HP.
 +
* [[Minicluster:HardwareTemp]], detalhes das máquinas Dell (projeto temporário).
 +
* [[Minicluster:Linux]], instalação do Linux Fedora.
 +
* [[Minicluster:Rede]], configuracão da Rede.
 +
* [[Minicluster:Firewall]], (off no momento)
 +
* [[Minicluster:NFS]]
 +
* [[Minicluster:NIS]]
 +
* [[Minicluster:DRBL]]
 +
* [[Minicluster:PXE]]
  
* Resultados do edital [http://www.ufrgs.br/propg/interno/noticias8.html Pro-Equipamentos 2009 PROPG]  
+
* [[Minicluster:Ssh]], ssh ou rsh sem senha.
** [http://www.ufrgs.br/propg/interno/Projetos%20aprovados%20Capes.pdf Planilha] de projetos aprovados UFRGS.
+
* [[Minicluster:Mpich]], configuração do Mpich, testes iniciais.
** [http://www.cpd.ufrgs.br/servicos/Registros%20de%20Precos%202009-1.pdf Registros de Preços UFRGS]
+
* [[Minicluster:Torque]], instalação e configuração do scheduler e do queue.
 +
* [[Minicluster:Mpich com torque]]
 +
* [[Minicluster:Compilando MPI]], criando, compilando e rodando MPI.
 +
* [[Minicluster:Fortran]], rodando.
  
==Dados Técnicos do Equipamento ==
 
* 16 máquinas escravo
 
* 2 máquinas mestre
 
* 1 switch
 
  
O projeto consiste na substituição do cluster existente por um cluster constituído por 18 máquinas, um “switch” e um “no break”.
+
* [[Minicluster:Resultados]], futuros, obviamente.
 +
* [[Minicluster:Gerenciamento]]
 +
* [[Minicluster:Testes]]: Funcionamento dos arquivos de testes.
 +
* [[Minicluster:Desabilitando IPV6]]:
  
===Máquina escravo===
+
* [[Minicluster:Usuários]]: Dicas e testes.
  
Descrição de uma máquina-escravo (de um total de 16 máquinas):
+
==Veja também==
  
* Dell® OptiPlex® 360 DT N-Series
+
===Filesystem===
* Processador Intel® Pentium® E5200 ( Dual-Core, 2.50 GHz, 2 MB L2 cache, 800 MHz FSB)
+
* [http://en.wikipedia.org/wiki/Global_File_System Global File System]
* SEM Sistema Operacional
+
* [http://www.communigate.com/notes/SFS.html Sistema de arquivos]
* SEM monitor, SEM disquete
+
* [http://linux.about.com/od/evm_guide/a/gdeevm69.htm Example: create a shared cluster container]
* Memória de 2GB DDR2 800MHz, 2DIMMs
 
* Disco rígido de 160GB SATA, 7200 RPM, 3.0Gb/s <!--e Cache DataBurst de 8 MB -->
 
* Placa Gráfica Integrada Intel® GMA 3100
 
* 3 anos de Garantia Padrão
 
<!-- * Valor estimado : R$ 1.350,00 x 16 = R$ 21.600,00 -->
 
  
===Máquina mestre===
+
===Outros===
 +
* MPI e MPE
 +
* [http://www.mcs.anl.gov/research/projects/perfvis/software/viewers/index.htm#Jumpshot Jumpshot]: Ferramenta gráfica para visualização de comunicações.
  
Descrição de uma máquina mestre (de um total de 2 máquinas):
+
===Dúvidas===
* Dell® OptiPlex® 360 DT N-Series
+
* Menor Latency (Software, Configuração, Rede...)
* Processador Intel® Pentium® E5200 ( Dual-Core, 2.50 GHz, 2 MB L2 cache, 800 MHz FSB)
 
* SEM Sistema Operacional
 
* Memória de 4GB DDR2 800MHz, 2DIMMs
 
* Disco rígido de 320GB SATA, 3.0Gb/s
 
* Placa Gráfica Integrada Intel® GMA 3100
 
* Teclado, Mouse
 
* Monitor Dell® LCD 19" Widescreen E1909W
 
* 3 anos de Garantia Padrão
 
<!-- Valor estimado : R$ 2.477,00 x 2 = R$ 4.954,00 -->
 
  
===Descrição do “Switch”===
+
==Referências==
  
O switch deve comportar todos os nós e ter espaço para possíveis expansões na quantidade de nós do cluster. Um switch que comportaria nossas necessidades seria Switch Gigabit-Ethernet Gerenciável com 24 portas, que possui como características principais:
+
Cluster
* Modelo: 3COM® 4200G 3CR17661-91
+
* http://debianclusters.org/index.php/Main_Page
* Empresa: Philips Business Communication
+
* http://bccd.net/ Bootable Cluster
* 24 saídas 10/100/1000 Mbit/s. Isso possibilita uma futura expansão do cluster até 24 nós.  
+
* http://www.linux.org/docs/ldp/howto/Beowulf-HOWTO/index.html, Simples Beowulf
* 2 saídas 10Gbit/s, uma poderá ser usada para acesso a um servidor para futura expansão de estrutura mestre-escravo e outra poderá ser usada para acesso a outro switch no futuro.
+
* http://www.phy.duke.edu/~rgb/brahma//beowulf_book/node68.html Beowulf book
* Todas as saídas têm auto-negociação. As placas de rede do servidor e dos nós devem ser configuradas também para auto-negociação, caso contrário a conexão será half-duplex em vez de full-duplex.
+
* http://www.ibiblio.org/pub/Linux/docs/HOWTO/Beowulf-HOWTO
<!-- * Valor estimado : R$ 3.600,00 -->
+
* http://www.ibiblio.org/pub/Linux/docs/HOWTO/Parallel-Processing-HOWTO
 +
* http://www.ibiblio.org/pub/Linux/docs/HOWTO/SMP-HOWTO
 +
* http://www.mcsr.olemiss.edu/bookshelf/articles/how_to_build_a_cluster.html book
  
Outro item que deve ser observado na compra de um switch é a taxa de encaminhamento, ou seja, um switch de baixa qualidade pode ter a mesma largura de banda em cada porta do switch que escolhemos e mesmo assim não conseguir a velocidade máxima anunciada quando várias portas são utilizadas.
+
Rede
 +
* http://www.yolinux.com/TUTORIALS/LinuxTutorialNetworking.html e vários outros tutoriais
 +
* http://home.comcast.net/~lafeyette_management/KludgeKollection/rsh-rlogin_enable-LINUX.HOWTO rsh e ssh
  
Um switch que permite o uso simultâneo de todas as portas na velocidade máxima é chamado de non-blocking. O switch escolhido ainda conta com recursos que podem ser gerenciados através de uma interface web apontada para o servidor web do switch. Os recursos incluem a possibilidade de replicar todo o tráfego para uma determinada porta, estatísticas de uso, etc.
+
Gerenciamento
 +
* http://www.ibm.com/developerworks/linux/library/l-11sysadtips/index.html Dicas gerenciamento
 +
* http://www.dataplow.com/ Software gerenciamento arquivos
 +
* http://www.perceus.org/portal/documentation, Manutenção e administração.
  
===No break (item não aprovado)===
+
==Outros Projetos==
 
+
* [http://www.ibm.com/developerworks/linux/library/l-11sysadtips/index.html]
O propósito do no break é evitar a perda de dados ou corrupção do sistema de arquivos em uma eventual queda de energia elétrica. Apenas as máquinas mestre serão conectadas ao no break.  
 
 
 
Quando está funcionando em sua capacidade plena, o modelo sugerido é capaz de suportar a falta de alimentação por um intervalo de tempo de aproximadamente 30 minutos. Além disso, como possui interface para comunicação com as máquinas, ele é capaz de avisá-las quando sua carga está por terminar, o que permite o desligamento correto das máquinas antes da interrupção total da alimentação.
 
  
* Modelo: APC® BR-1500 120V - BR1500.
 
* Fabricante: APC.
 
<!-- * Valor estimado: R$ 900,00.-->
 
 
== Montagem Físisa ==
 
== Rede Elétrica e Arrefecimento ==
 
 
==Outros Projetos==
 
 
* [http://www.cacr.caltech.edu/beowulf/tutorial/building.html http://www.cacr.caltech.edu/beowulf/tutorial/building.html]
 
* [http://www.cacr.caltech.edu/beowulf/tutorial/building.html http://www.cacr.caltech.edu/beowulf/tutorial/building.html]
  
Linha 75: Linha 69:
 
* [http://abax.if.usp.br/drupal5/files/manual_abax.pdf Manual ABAX]
 
* [http://abax.if.usp.br/drupal5/files/manual_abax.pdf Manual ABAX]
 
* [http://abax.if.usp.br/drupal5/files/abax_for_dummies.pdf ABAX for dummies]
 
* [http://abax.if.usp.br/drupal5/files/abax_for_dummies.pdf ABAX for dummies]
 +
 +
==Programacão==
 +
* http://software.intel.com/en-us/articles/superscalar-programming-101-matrix-multiply-part-1/
 +
[[Categoria:Minicluster]]

Edição atual tal como às 15h25min de 26 de julho de 2017


Veja também

Filesystem

Outros

  • MPI e MPE
  • Jumpshot: Ferramenta gráfica para visualização de comunicações.

Dúvidas

  • Menor Latency (Software, Configuração, Rede...)

Referências

Cluster

Rede

Gerenciamento

Outros Projetos

Programacão