InChIKey

Der InChIKey ist ein Identifikator für Moleküle. Es handelt sich um einen um eine kompakte Form des maschinenlesbaren Strukturcodes des InChI, der von der IUPAC entwickelt wurde. Dabei wird auf die SHA-256-Hashfunktion zurückgegriffen. Im ersten Block aus 14 Zeichen wird die Molekülstruktur abgebildet. Der zweite Block bildet mit 8 Zeichen die Isomerie ab. Drei zusätzliche Buchstaben geben an, ob Standard-InChI die Grundlage bildete, wie das Molekül protoniert ist und welche InChI-Version verwendet wurde. Zwei Trennzeichen sind enthalten, sodass die Gesamtlänge 27 Zeichen beträgt. Er verwendet ausschließlich ASCII-Großbuchstaben. Dabei muss beachtet werden, dass es durch die Verkürzung zu Kollisionen kommen kann. Entwickelt wurde die Kurzform, um effizient mit Suchmaschinen Einträge über chemische Substanzen zu finden oder Datenbanken abzufragen.

  1. Eintrag zu InChIKey. In: IUPAC (Hrsg.): Compendium of Chemical Terminology. The “Gold Book”. doi:10.1351/goldbook.11455.
  2. Igor Pletnev, Andrey Erin, Alan McNaught, Kirill Blinov, Dmitrii Tchekhovskoi, Steve Heller: InChIKey collision resistance: an experimental testing. In: Journal of Cheminformatics. Band 4, Nr. 1, 20. Dezember 2012, ISSN 1758-2946, S. 39, doi:10.1186/1758-2946-4-39, PMID 23256896, PMC 3558395 (freier Volltext).
  3. Christopher Southan: InChI in the wild: an assessment of InChIKey searching in Google. In: Journal of Cheminformatics. Band 5, Nr. 1, 11. Februar 2013, ISSN 1758-2946, S. 10, doi:10.1186/1758-2946-5-10, PMID 23399051, PMC 3598674 (freier Volltext).