Mudanças entre as edições de "Minicluster"

De WikiLICC
Ir para: navegação, pesquisa
m (Dados Técnicos)
m
 
(129 revisões intermediárias pelo mesmo usuário não estão sendo mostradas)
Linha 1: Linha 1:
Página do Projeto do Minicluster
+
* [[Projeto Minicluster]] LICC enviado a CAPES.
 +
* [[Minicluster:Hardware]], detalhes das máquinas HP.
 +
* [[Minicluster:HardwareTemp]], detalhes das máquinas Dell (projeto temporário).
 +
* [[Minicluster:Linux]], instalação do Linux Fedora.
 +
* [[Minicluster:Rede]], configuracão da Rede.
 +
* [[Minicluster:Firewall]], (off no momento)
 +
* [[Minicluster:NFS]]
 +
* [[Minicluster:NIS]]
 +
* [[Minicluster:DRBL]]
 +
* [[Minicluster:PXE]]
  
* Resultados do edital [http://www.ufrgs.br/propg/interno/noticias8.html Pro-Equipamentos 2009]
+
* [[Minicluster:Ssh]], ssh ou rsh sem senha.
 +
* [[Minicluster:Mpich]], configuração do Mpich, testes iniciais.
 +
* [[Minicluster:Torque]], instalação e configuração do scheduler e do queue.
 +
* [[Minicluster:Mpich com torque]]
 +
* [[Minicluster:Compilando MPI]], criando, compilando e rodando MPI.
 +
* [[Minicluster:Fortran]], rodando.
  
* [http://www.cpd.ufrgs.br/servicos/Registros%20de%20Precos%202009-1.pdf Registros de Preços UFRGS]
 
  
==Dados Técnicos do Equipamento ==
+
* [[Minicluster:Resultados]], futuros, obviamente.
* 16 máquinas escravo
+
* [[Minicluster:Gerenciamento]]
* 2 máquinas mestre
+
* [[Minicluster:Testes]]: Funcionamento dos arquivos de testes.
* 1 switch
+
* [[Minicluster:Desabilitando IPV6]]:
  
O projeto consiste na substituição do cluster existente por um cluster constituído por 18 máquinas, um “switch” e um “no break”. O valor total estimado é de R$ 31.054,00.  
+
* [[Minicluster:Usuários]]: Dicas e testes.
  
===Máquina escravo===
+
==Veja também==
  
Descrição de uma máquina-escravo (de um total de 16 máquinas):  
+
===Filesystem===
 +
* [http://en.wikipedia.org/wiki/Global_File_System Global File System]
 +
* [http://www.communigate.com/notes/SFS.html Sistema de arquivos]
 +
* [http://linux.about.com/od/evm_guide/a/gdeevm69.htm Example: create a shared cluster container]
  
* Dell® OptiPlex® 360 DT N-Series
+
===Outros===
* Processador Intel® Pentium® E5200 ( Dual-Core, 2.50 GHz, 2 MB L2 cache, 800 MHz FSB)
+
* MPI e MPE
* SEM Sistema Operacional
+
* [http://www.mcs.anl.gov/research/projects/perfvis/software/viewers/index.htm#Jumpshot Jumpshot]: Ferramenta gráfica para visualização de comunicações.
* SEM monitor, SEM disquete
 
* Memória de 2GB DDR2 800MHz, 2DIMMs
 
* Disco rígido de 160GB SATA, 7200 RPM, 3.0Gb/s <!--e Cache DataBurst de 8 MB -->
 
* Placa Gráfica Integrada Intel® GMA 3100
 
* 3 anos de Garantia Padrão
 
<!-- * Valor estimado : R$ 1.350,00 x 16 = R$ 21.600,00 -->
 
  
===Máquina mestre===
+
===Dúvidas===
 +
* Menor Latency (Software, Configuração, Rede...)
  
Descrição de uma máquina mestre (de um total de 2 máquinas):
+
==Referências==
* Dell® OptiPlex® 360 DT N-Series
 
* Processador Intel® Pentium® E5200 ( Dual-Core, 2.50 GHz, 2 MB L2 cache, 800 MHz FSB)
 
* SEM Sistema Operacional
 
* Memória de 4GB DDR2 800MHz, 2DIMMs
 
* Disco rígido de 320GB SATA, 3.0Gb/s
 
* Placa Gráfica Integrada Intel® GMA 3100
 
* Teclado, Mouse
 
* Monitor Dell® LCD 19" Widescreen E1909W
 
* 3 anos de Garantia Padrão
 
<!-- Valor estimado : R$ 2.477,00 x 2 = R$ 4.954,00 -->
 
  
===Descrição do “Switch”===
+
Cluster
 +
* http://debianclusters.org/index.php/Main_Page
 +
* http://bccd.net/ Bootable Cluster
 +
* http://www.linux.org/docs/ldp/howto/Beowulf-HOWTO/index.html, Simples Beowulf
 +
* http://www.phy.duke.edu/~rgb/brahma//beowulf_book/node68.html Beowulf book
 +
* http://www.ibiblio.org/pub/Linux/docs/HOWTO/Beowulf-HOWTO
 +
* http://www.ibiblio.org/pub/Linux/docs/HOWTO/Parallel-Processing-HOWTO
 +
* http://www.ibiblio.org/pub/Linux/docs/HOWTO/SMP-HOWTO
 +
* http://www.mcsr.olemiss.edu/bookshelf/articles/how_to_build_a_cluster.html book
  
O switch deve comportar todos os nós e ter espaço para possíveis expansões na quantidade de nós do cluster. Um switch que comportaria nossas necessidades seria Switch Gigabit-Ethernet Gerenciável com 24 portas, que possui como características principais:
+
Rede
* Modelo: 3COM® 4200G 3CR17661-91
+
* http://www.yolinux.com/TUTORIALS/LinuxTutorialNetworking.html e vários outros tutoriais
* Empresa: Philips Business Communication
+
* http://home.comcast.net/~lafeyette_management/KludgeKollection/rsh-rlogin_enable-LINUX.HOWTO rsh e ssh
* 24 saídas 10/100/1000 Mbit/s. Isso possibilita uma futura expansão do cluster até 24 nós.  
 
* 2 saídas 10Gbit/s, uma poderá ser usada para acesso a um servidor para futura expansão de estrutura mestre-escravo e outra poderá ser usada para acesso a outro switch no futuro.
 
* Todas as saídas têm auto-negociação. As placas de rede do servidor e dos nós devem ser configuradas também para auto-negociação, caso contrário a conexão será half-duplex em vez de full-duplex.  
 
<!-- * Valor estimado : R$ 3.600,00 -->
 
  
Outro item que deve ser observado na compra de um switch é a taxa de encaminhamento, ou seja, um switch de baixa qualidade pode ter a mesma largura de banda em cada porta do switch que escolhemos e mesmo assim não conseguir a velocidade máxima anunciada quando várias portas são utilizadas.
+
Gerenciamento
 +
* http://www.ibm.com/developerworks/linux/library/l-11sysadtips/index.html Dicas gerenciamento
 +
* http://www.dataplow.com/ Software gerenciamento arquivos
 +
* http://www.perceus.org/portal/documentation, Manutenção e administração.
  
Um switch que permite o uso simultâneo de todas as portas na velocidade máxima é chamado de non-blocking. O switch escolhido ainda conta com recursos que podem ser gerenciados através de uma interface web apontada para o servidor web do switch. Os recursos incluem a possibilidade de replicar todo o tráfego para uma determinada porta, estatísticas de uso, etc.
+
==Outros Projetos==
 
+
* [http://www.ibm.com/developerworks/linux/library/l-11sysadtips/index.html]
===No break (item não aprovado)===
 
 
 
O propósito do no break é evitar a perda de dados ou corrupção do sistema de arquivos em uma eventual queda de energia elétrica. Apenas as máquinas mestre serão conectadas ao no break.  
 
  
Quando está funcionando em sua capacidade plena, o modelo sugerido é capaz de suportar a falta de alimentação por um intervalo de tempo de aproximadamente 30 minutos. Além disso, como possui interface para comunicação com as máquinas, ele é capaz de avisá-las quando sua carga está por terminar, o que permite o desligamento correto das máquinas antes da interrupção total da alimentação.
 
 
* Modelo: APC® BR-1500 120V - BR1500.
 
* Fabricante: APC.
 
<!-- * Valor estimado: R$ 900,00.-->
 
 
==Outros Projetos==
 
 
* [http://www.cacr.caltech.edu/beowulf/tutorial/building.html http://www.cacr.caltech.edu/beowulf/tutorial/building.html]
 
* [http://www.cacr.caltech.edu/beowulf/tutorial/building.html http://www.cacr.caltech.edu/beowulf/tutorial/building.html]
  
* Projeto [http://abax.if.usp.br/drupal5/files/delyra_cluster.pdf Delyra]  do IF da USP.
 
 
* [http://abax.if.usp.br/drupal5/files/ if.usp]
 
* [http://abax.if.usp.br/drupal5/files/ if.usp]
*
+
* [http://abax.if.usp.br/drupal5/files/delyra_cluster.pdf Projeto Delyra]  do IF da USP.
 +
* [http://abax.if.usp.br/drupal5/files/manual_abax.pdf Manual ABAX]
 +
* [http://abax.if.usp.br/drupal5/files/abax_for_dummies.pdf ABAX for dummies]
 +
 
 +
==Programacão==
 +
* http://software.intel.com/en-us/articles/superscalar-programming-101-matrix-multiply-part-1/
 +
[[Categoria:Minicluster]]

Edição atual tal como às 15h25min de 26 de julho de 2017


Veja também

Filesystem

Outros

  • MPI e MPE
  • Jumpshot: Ferramenta gráfica para visualização de comunicações.

Dúvidas

  • Menor Latency (Software, Configuração, Rede...)

Referências

Cluster

Rede

Gerenciamento

Outros Projetos

Programacão