Projeto Minicluster

De WikiLICC
Revisão de 15h23min de 26 de outubro de 2009 por Dago (Discussão | contribs) (Perspectiva de incremento da produção científica)
Ir para: navegação, pesquisa

O presente projeto segue a organização exigida pela Capes em seu edital 11/2009.

Justificativa técnico-científica para a aquisição dos equipamentos

O novo equipamento substituirá antigas máquinas instaladas no LICC a partir de 1996, que já são obsoletas. Ademais, o novo equipamento permitirá o oferecimento de cursos de capacitação em computação paralela, atividade esta seriamente restrita devido à inadequação das máquinas hoje existentes no LICC.

Experiência prévia do uso compartilhado de equipamentos

O Laboratório Integrado de Computação Científica (LICC) dá suporte computacional ao Programa de Pós-Graduação em Matemática Aplicada da UFRGS (PPGMAp/UFRGS) desde 1996, sendo até hoje seu único laboratório de recursos computacionais. Foi criado com o objetivo de atender as necessidades computacionais dos pesquisadores e alunos do PPGMAp/UFRGS, possibilitando simulações computacionais e a editoração das dissertações e teses.

Em 1995, uma estação de trabalho DIGITAL® foi adquirida com recursos da FINEP; este equipamento possibilitou muitas atividades de desenvolvimento de software em projetos de pesquisa, teses de mestrado e doutorado, até sua desativação em 2001.

Em 1997, foi adquirido um servidor computacional Silicon Graphics Origin® 2000, dotado de dois processadores, com recursos financeiros provenientes da FAPERGS. Tal servidor permitiu a realização de simulações que demandavam grande tempo de processamento (normalmente medido em dias), além do desenvolvimento de novos algoritmos paralelos nas áreas da Álgebra Matricial Computacional e da Dinâmica de Fluídos Computacional.

Posteriormente, com o avanço tecnológico dos microprocessadores, bem como dos protocolos de transferência de dados, foi montado um minicluster, composto por quatro microcomputadores com processador Pentium IV®, rodando sistema operacional Linux, os quais foram conectados a um switch de 100MBPS, permitindo com isso comunicação ponto-a-ponto entre seus processadores. O software desde então usado no desenvolvimento de algoritmos paralelos é integralmente de domínio público, contando com as bibliotecas MPICH (para troca de mensagens entre os processadores) e compiladores Fortran95 e HPF (High Performance Fortran). Esse minicluster continua sendo utilizado até os dias de hoje.

Além do suporte aos alunos mestrandos e doutorandos do PPGMAp, o LICC também oferece importante assistência aos alunos bolsistas de Iniciação Científica (IC) de vários projetos de pesquisa sob orientação dos pesquisadores do programa. Atualmente, cerca de 30 alunos, entre doutorandos e mestrandos do PPGMAp e bolsistas de IC, desenvolvem suas atividades computacionais no LICC.

Grupos de Pesquisa Participantes

Os seguintes grupos de pesquisa, cadastrados junto ao CNPq, integram a equipe deste projeto:

  • Algoritmos Algébricos.
  • Algoritmos e Métodos Analíticos e Numéricos em Matemática Aplicada.
  • GEN-C Grupo em Estudos Numéricos e Combustão.
  • Métodos Matriciais, Funcionais e Computacionais em Modelos Evolutivos.
  • Transporte de Partículas e Transferência Radiativa.


Contexto no qual se insere o novo equipamento

Nos últimos anos o Centro Nacional de Supercomputação (CESUP) investiu em um novo sistema para processamento de Alto Desempenho, com recursos da ordem US$ 400.000,00 concedido pelo Ministério da Ciência e Tecnologia. Entretanto, é necessário treinar alunos e pesquisadores para que tal equipamento seja utilizado de forma eficiente em trabalhos de alto nível envolvendo computação científica. Assim sendo, uma das principais funções do novo cluster, a ser instalado no LICC, é a de oferecer aos alunos e pesquisadores, tanto do PPGMAp quanto da comunidade UFRGS, cursos introdutórios de capacitação em computação paralela. Para isto, o PPGMAp conta com a experiência do professores na área de computação científica. Secundariamente, o novo equipamento do LICC será utilizado por alunos e professores do PPGMAP nos estágios iniciais de pesquisa envolvendo cálculos de grande porte e simulações. Observa-se que todos os grupos de pesquisa associados ao LICC demandam pessoal capacitado e equipamentos adequados para a realização de seus trabalhos.

Perspectiva de incremento da produção científica

Dada a potencialidade da nova infra-estrutura fornecida pelo CESUP-UFRGS, através do SunFire Cluster, acreditamos que a produção científica dos pesquisadores, treinados através do LICC para a utilização de tal equipamento, será certamente incrementada. Além disso, o próprio cluster do LICC possibilitará o desenvolvimento de projetos de pesquisa e pós-graduação, resultando como produto artigos científicos, teses, dissertações e relatórios técnicos.

Equipamento

O projeto consiste na substituição do cluster existente por um cluster constituído por 18 máquinas, um “switch” e um “no break”. O valor total estimado é de R$ 31.054,00 (trinta e um mil e cinquenta e quatro reais).

Máquina escravo

Descrição de uma máquina-escravo (de um total de 16 máquinas):

  • Dell® OptiPlex® 360 DT N-Series
  • Processador Intel® Pentium® E5200 ( Dual-Core, 2.50 GHz, 2 MB L2 cache, 800 MHz FSB)
  • Sistema Operacional não instalado de fábrica
  • Memória de 2GB DDR2 800MHz, 2DIMMs
  • Disco rígido de 160GB SATA, 7200 RPM, 3.0Gb/s e Cache DataBurst de 8 MB
  • Placa Gráfica Integrada Intel® GMA 3100
  • Sem monitor, sem disquete
  • 3 anos de Garantia Padrão
  • Valor estimado : R$ 1.350,00 x 16 = R$ 21.600,00

Máquina mestre

Descrição de uma máquina mestre (de um total de 2 máquinas):

  • Dell® OptiPlex® 360 DT N-Series
  • Processador Intel® Pentium® E5200 ( Dual-Core, 2.50 GHz, 2 MB L2 cache, 800 MHz FSB)
  • Sistema Operacional não instalado de fábrica
  • Memória de 4GB DDR2 800MHz, 2DIMMs
  • Disco rígido de 320GB SATA, 3.0Gb/s
  • Placa Gráfica Integrada Intel® GMA 3100
  • Teclado, Mouse
  • Monitor Dell® LCD 19" Widescreen E1909W
  • 3 anos de Garantia Padrão
  • Valor estimado : R$ 2.477,00 x 2 = R$ 4.954,00

Descrição do “Switch”

O switch deve comportar todos os nós e ter espaço para possíveis expansões na quantidade de nós do cluster. Um switch que comportaria nossas necessidades seria Switch Gigabit-Ethernet Gerenciável com 24 portas, que possui como características principais:

  • Modelo: 3COM® 4200G 3CR17661-91
  • Empresa: Philips Business Communication
  • 24 saídas 10/100/1000 Mbit/s. Isso possibilita uma futura expansão do cluster até 24 nós.
  • 2 saídas 10Gbit/s, uma poderá ser usada para acesso a um servidor para futura expansão de estrutura mestre-escravo e outra poderá ser usada para acesso a outro switch no futuro.
  • Todas as saídas têm auto-negociação. As placas de rede do servidor e dos nós devem ser configuradas também para auto-negociação, caso contrário a conexão será half-duplex em vez de full-duplex.
  • Valor estimado : R$ 3.600,00

Outro item que deve ser observado na compra de um switch é a taxa de encaminhamento, ou seja, um switch de baixa qualidade pode ter a mesma largura de banda em cada porta do switch que escolhemos e mesmo assim não conseguir a velocidade máxima anunciada quando várias portas são utilizadas.

Um switch que permite o uso simultâneo de todas as portas na velocidade máxima é chamado de non-blocking. O switch escolhido ainda conta com recursos que podem ser gerenciados através de uma interface web apontada para o servidor web do switch. Os recursos incluem a possibilidade de replicar todo o tráfego para uma determinada porta, estatísticas de uso, etc.

No break

O propósito do no break é evitar a perda de dados ou corrupção do sistema de arquivos em uma eventual queda de energia elétrica. Apenas as máquinas mestre serão conectadas ao no break.

Quando está funcionando em sua capacidade plena, o modelo sugerido é capaz de suportar a falta de alimentação por um intervalo de tempo de aproximadamente 30 minutos. Além disso, como possui interface para comunicação com as máquinas, ele é capaz de avisá-las quando sua carga está por terminar, o que permite o desligamento correto das máquinas antes da interrupção total da alimentação.

  • Modelo: APC® BR-1500 120V - BR1500.
  • Fabricante: APC.
  • Valor estimado: R$ 900,00.