SIMAP

SIMAP (Similarity Matrix of Proteins; dt.: Ähnlichkeitsmatrix für Proteine) ist eine Datenbank für Proteinähnlichkeiten. Diese Datenbank beinhaltet alle bisher veröffentlichten Proteinsequenzen und wird fortlaufend aktualisiert. Ähnlichkeiten der Proteine werden dabei unter Verwendung des FASTA-Algorithmus berechnet.

Es handelt sich um die bisher einzige derartige Datenbank, die tatsächlich alle bisher bekannten Proteine mit einbezieht. Seit 2014 wird eine neue SIMAP-Datenbank (SIMAP2) entwickelt. SIMAP2 verwendet den exakten Smith-Waterman-Algorithmus und soll daher eine bessere Empfindlichkeit als das ursprüngliche Projekt erreichen. Dieses wurde Ende 2014 letztmals aktualisiert, bleibt aber noch so lange online, wie es wissenschaftlich relevant ist. SIMAP2 wird nicht mehr mit BOINCSIMAP, sondern mit einem Hochleistungscomputer der Universität Wien berechnet.

  1. Roland Arnold, Florian Goldenberg, Hans-Werner Mewes, Thomas Rattei: SIMAP—the database of all-against-all protein sequence similarities and annotations with new interfaces and increased coverage. In: Nucleic Acids Research. Band 42, D1, Januar 2014, ISSN 0305-1048, S. D279–D284, doi:10.1093/nar/gkt970, PMID 24165881, PMC 3965014 (freier Volltext).
  2. Thomas Rattei, Patrick Tischler, Stefan Götz, Marc-André Jehl, Jonathan Hoser, Roland Arnold, Ana Conesa, Hans-Werner Mewes: SIMAP—a comprehensive database of pre-calculated protein sequence similarities, domains, annotations and clusters. In: Nucleic Acids Research. Band 38, suppl_1, Januar 2010, ISSN 0305-1048, S. D223–D226, doi:10.1093/nar/gkp949, PMID 19906725, PMC 2808863 (freier Volltext).
  3. T. Rattei, P. Tischler, R. Arnold, F. Hamberger, J. Krebs, J. Krumsiek, B. Wachinger, V. Stumpflen, W. Mewes: SIMAP structuring the network of protein similarities. In: Nucleic Acids Research. Band 36, Database, 23. Dezember 2007, ISSN 0305-1048, S. D289–D292, doi:10.1093/nar/gkm963, PMID 18037617, PMC 2238827 (freier Volltext).