സിമ്പ്ലിഫൈഡ് മോളിക്യൂലാർ-ഇൻപുട് ലൈൻ-എൻട്രി സിസ്റ്റം
എക്സ്റ്റൻഷൻ | .smi |
---|---|
ഇന്റർനെറ്റ് മീഡിയ തരം | chemical/x-daylight-smiles |
ഫോർമാറ്റ് തരം | chemical file format |
ലളിതമായ ആസ്കി അക്ഷരശൃംഖല ഉപയോഗിച്ചുകൊണ്ട് ഒരു രാസവസ്തുവിന്റെ തന്മാത്രാരൂപത്തെ വിവരിക്കുന്ന രീതിയാണ് സിമ്പ്ലിഫൈഡ് മോളിക്യൂലാർ-ഇൻപുട് ലൈൻ-എൻട്രി സിസ്റ്റം (The simplified molecular-input line-entry system (SMILES)) അഥവാ സ്മൈൽസ്. ഇങ്ങനെ ലഭ്യമാകുന്ന സൂത്രവാക്യം ഉപയോഗിച്ച് മിക്ക തന്മാത്രാഎഡിറ്ററുകൾക്കും ഈ സൂത്രവാക്യങ്ങളെ തിരികെ ദ്വിമാനചിത്രീകരണമായിട്ടോ അല്ലെങ്കിൽ ത്രിമാനരൂപങ്ങളായോ മാറ്റുവാൻ കഴിയുന്നതാണ്.
1980 -കളിലാണ് ഇതിന്റെ തുടക്കം. പിന്നീട് പലതരത്തിൽ മാറ്റങ്ങൾ വരുത്തുകയും കൂട്ടിച്ചേർക്കലുകൾ ഉണ്ടാവുകയും ചെയ്തിട്ടുണ്ട്. 2007 -ൽ OpenSMILES എന്നറിയപ്പെട്ട ഒരു തുറന്ന അംഗീകൃതമാതൃക ഓപൺസോഴ്സ് രസതന്ത്ര കമ്മ്യൂണിറ്റി വികസിപ്പിച്ചെടുത്തു. ഇത്തരം മറ്റുരീതികൾ Wiswesser line notation (WLN), ROSDAL, SYBYL Line Notation (SLN) ഒക്കെയാണ്.
ചരിത്രം
[തിരുത്തുക]ഉപയോഗിക്കുന്ന അംഗീകൃതവാക്കുകൾ
[തിരുത്തുക]ഗ്രാഫുപയോഗിച്ചുള്ള രീതികളുടെ നിർവചനങ്ങൾ
[തിരുത്തുക]വിവരണം
[തിരുത്തുക]ആറ്റങ്ങൾ
[തിരുത്തുക]ആറ്റങ്ങളെ അവയുടെ ആവർത്തനപട്ടികയിലുള്ള അതേരീതിയിൽ മൂലകങ്ങളെ, രേഖപ്പെടുത്തുന്നരീതിയിൽത്തന്നെയാണ് ഇവിടെയും ഉൾക്കൊള്ളിച്ചിരിക്കുന്നത്. അവയെ ചതുരബ്രാക്കറ്റിലാവും കാണിക്കുക, ഉദാഹരണാത്തിന് സ്വർണ്ണത്തെ [Au] എന്ന്. താഴെപ്പറയുന്നിടങ്ങളിൽ ബ്രാക്കറ്റുകൾ വേണ്ടെന്നുവയ്ക്കാറുണ്ട്:
- are in the "organic subset" of B, C, N, O, P, S, F, Cl, Br, or I, and
- have no formal charge, and
- have the number of hydrogens attached implied by the SMILES valence model (typically their normal valence, but for N and P it is 3 or 5, and for S it is 2, 4 or 6), and
- are the normal isotopes, and
- are not chiral centers.
ബാക്കി എല്ലാ മൂലകങ്ങളെയും ചതുരബ്രാക്കറ്റുകളിൽത്തന്നെ വേണം ചിത്രീകരിക്കാൻ. ചാർജുള്ളവയെ കൃത്യമായിത്തന്നെ വേണം രേഖപ്പെടുത്താൻ. ഉദാഹരണത്തിന് വെള്ളത്തിന്റെ സ്മൈൽസ് ഒന്നുകിൽ O അല്ലെങ്കിൽ [OH2]. ഹൈഡ്രജൻ വേറൊരു ആറ്റമായി വേണമെങ്കിൽ കാണിക്കാം; വെള്ളത്തെ [H]O[H] എന്നും എഴുതാം.
When brackets are used, the symbol H is added if the atom in brackets is bonded to one or more hydrogen, followed by the number of hydrogen atoms if greater than 1, then by the sign '+' for a positive charge or by '-' for a negative charge. For example, [NH4+] for ammonium. If there is more than one charge, it is normally written as digit; however, it is also possible to repeat the sign as many times as the ion has charges: one may write either [Ti+4] or [Ti++++] for Titanium IV (Ti4+). Thus, the hydroxide anion is represented by [OH-], the hydronium cation is [OH3+] and the cobalt III cation (Co3+) is either [Co+3] or [Co+++].
ബന്ധനങ്ങൾ
[തിരുത്തുക]ഒരു ബന്ധനത്തെ ചിത്രീകരിക്കുന്നത് ഇതിലേതെങ്കിലും ഒരു ചിഹ്നം ഉപയോഗിച്ചാണ്. '.' '-' '=' '#' '$' ':' '/' or '\'.
ചാക്രികരൂപങ്ങൾ
[തിരുത്തുക]ഗന്ധം
[തിരുത്തുക]ശാഖകൾ
[തിരുത്തുക]ത്രിമാനവ്യത്യസ്തഘടനാരൂപങ്ങൾ
[തിരുത്തുക]ഉദാഹരണമായി ബീറ്റാകരോട്ടിന് ഒന്നിടവിട്ട ഏകബന്ധങ്ങളും ഇരട്ടബന്ധങ്ങളും ഉണ്ട്, അവയെ ഇങ്ങനെ എഴുതാം. CC1CCC/C(C)=C1/C=C/C(C)=C/C=C/C(C)=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C2=C(C)/CCCC2(C)C.
ഐസോടോപ്പുകൾ
[തിരുത്തുക]ഉദാഹരണങ്ങൾ
[തിരുത്തുക]Molecule | Structure | SMILES Formula |
---|---|---|
Dinitrogen | N≡N | N#N |
Methyl isocyanate (MIC) | CH3–N=C=O | CN=C=O |
Copper(II) sulfate | Cu2+ SO42− | [Cu+2].[O-]S(=O)(=O)[O-] |
Vanillin | O=Cc1ccc(O)c(OC)c1 OCc1cc(C=O)ccc1O | |
Melatonin (C13H16N2O2) | CC(=O)NCCC1=CNc2c1cc(OC)cc2 CC(=O)NCCc1c[nH]c2ccc(OC)cc12 | |
Flavopereirin (C17H15N2) | CCc(c1)ccc2[n+]1ccc3c2[nH]c4c3cccc4 CCc1c[n+]2ccc3c4ccccc4[nH]c3c2cc1 | |
Nicotine (C10H14N2) | CN1CCC[C@H]1c2cccnc2 | |
Oenanthotoxin (C17H22O2) | CCC[C@@H](O)CC\C=C\C=C\C#CC#C\C=C\CO CCC[C@@H](O)CC/C=C/C=C/C#CC#C/C=C/CO | |
Pyrethrin II (C22H28O5) | CC1=C(C(=O)C[C@@H]1OC(=O)[C@@H]2[C@H](C2(C)C)/C=C(\C)/C(=O)OC)C/C=C\C=C | |
Aflatoxin B1 (C17H12O6) | O1C=C[C@H]([C@H]1O2)c3c2cc(OC)c4c3OC(=O)C5=C4CCC(=O)5 | |
Glucose (glucopyranose) (C6H12O6) | OC[C@@H](O1)[C@@H](O)[C@H](O)[C@@H](O)[C@@H](O)1 | |
Bergenin (cuscutin) (a resin) (C14H16O9) | OC[C@@H](O1)[C@@H](O)[C@H](O)[C@@H]2[C@@H]1c3c(O)c(OC)c(O)cc3C(=O)O2 | |
A pheromone of the Californian scale insect | CC(=O)OCCC(/C)=C\C[C@H](C(C)=C)CCC=C | |
2S,5R-Chalcogran: a pheromone of the bark beetle Pityogenes chalcographus[1] | CC[C@H](O1)CC[C@@]12CCCO2 | |
Alpha-thujone (C10H16O) | CC(C)[C@@]12C[C@@H]1[C@@H](C)C(=O)C2 | |
Thiamine (C12H17N4OS+) (vitamin B1) |
OCCc1c(C)[n+](cs1)Cc2cnc(C)nc2N |
To illustrate a molecule with more than 9 rings, consider Cephalostatin-1,[2] a steroidic trisdecacyclic pyrazine with the empirical formula C54H74N2O10 isolated from the Indian Ocean hemichordate Cephalodiscus gilchristi:
Starting with the left-most methyl group in the figure:
Note that '%' appears in front of the index of ring closure labels above 9; see § Rings above.
സ്മൈൽസിന്റെ മറ്റു ഉദാഹരണങ്ങൾ
[തിരുത്തുക]വിപുലീകരണം
[തിരുത്തുക]അങ്ങോട്ടുമിങ്ങോട്ടും മാറ്റുന്നത്
[തിരുത്തുക]ഇവയും കാണുക
[തിരുത്തുക]- SMILES arbitrary target specification SMARTS language for specification of substructural queries.
- SYBYL Line Notation (another line notation)
- Molecular Query Language – query language allowing also numerical properties, e.g. physicochemical values or distances
- Chemistry Development Kit (2D layout and conversion)
- International Chemical Identifier (InChI), the IUPAC's alternative to SMILES.
- OpenBabel, JOELib, OELib (conversion)
അവലംബം
[തിരുത്തുക]- ↑ Byers, JA; Birgersson, G; Löfqvist, J; Appelgren, M; Bergström, G (Mar 1990). "Isolation of pheromone synergists of bark beetle,Pityogenes chalcographus, from complex insect-plant odors by fractionation and subtractive-combination bioassay" (PDF). Journal of Chemical Ecology. 16 (3): 861–76. doi:10.1007/BF01016496. PMID 24263601.
- ↑ National Center for Biotechnology Information (NCBI). PubChem Compound. (accessed May 12, 2012) PubChem Compound CID=183413 (Cephalostatin-1)
അധികവായനയ്ക്ക്
[തിരുത്തുക]- Anderson, E.; Veith, G. D.; Weininger, D. (1987). SMILES: A line notation and computerized interpreter for chemical structures. Duluth, MN: U.S. EPA, Environmental Research Laboratory-Duluth. Report No. EPA/600/M-87/021.
{{cite book}}
: Invalid|ref=harv
(help); Unknown parameter|name-list-format=
ignored (|name-list-style=
suggested) (help) - Helson, H. E. (1999). "Structure Diagram Generation". In Lipkowitz, K. B.; Boyd, D. B. (eds.). Rev. Comput. Chem. Vol. 13. New York: Wiley-VCH. pp. 313–398. doi:10.1002/9780470125908.ch6.
{{cite book}}
: Invalid|ref=harv
(help); Unknown parameter|name-list-format=
ignored (|name-list-style=
suggested) (help) - Weininger, David (February 1988). "SMILES, a chemical language and information system. 1. Introduction to methodology and encoding rules". Journal of Chemical Information and Modeling. 28 (1): 31–6. doi:10.1021/ci00057a005.
{{cite journal}}
: Invalid|ref=harv
(help); Unknown parameter|name-list-format=
ignored (|name-list-style=
suggested) (help) - Weininger, David; Weininger, Arthur; Weininger, Joseph L. (May 1989). "SMILES. 2. Algorithm for generation of unique SMILES notation". Journal of Chemical Information and Modeling. 29 (2): 97–101. doi:10.1021/ci00062a008.
{{cite journal}}
: Invalid|ref=harv
(help); Unknown parameter|name-list-format=
ignored (|name-list-style=
suggested) (help) - Weininger, David (August 1990). "SMILES. 3. DEPICT. Graphical depiction of chemical structures". Journal of Chemical Information and Modeling. 30 (3): 237–43. doi:10.1021/ci00067a005.
{{cite journal}}
: Invalid|ref=harv
(help); Unknown parameter|name-list-format=
ignored (|name-list-style=
suggested) (help)
പുറത്തേക്കുള്ള കണ്ണികൾ
[തിരുത്തുക]- "SMILES – A Simplified Chemical Language"
- The OpenSMILES home page
- "SMARTS – SMILES Extension"
- Daylight SMILES tutorial
- Parsing SMILES
സ്മൈൽസുമായി ബന്ധപ്പെട്ടിട്ടുള്ള സൊഫ്റ്റ്വേറുകളും സഹായഉപകരണങ്ങളും
[തിരുത്തുക]- NCI/CADD Chemical Identifier Resolver – resolves or generates SMILES from chemical names, CAS Registry Numbers, InChI/InChIKey and many other chemical structure file formats
- NCI/CADD Online SMILES Translator and Structure File Generator Archived 2001-05-01 at the Wayback Machine. – Java online molecule editor
- PubChem server side structure editor – online molecule editor
- smi23d – 3D Coordinate Generation
- Daylight Depict Archived 2001-12-02 at the Wayback Machine. – Translate a SMILES formula into graphics
- GIF/PNG-Creator for 2D Plots of Chemical Structures Archived 2004-10-15 at the Wayback Machine.
- JME molecule editor Archived 2001-04-28 at the Wayback Machine. - Chemical editor/viewer and SMILES/SMARTS generator in Java
- JSME molecule editor Archived 2015-01-06 at the Wayback Machine. - Free chemical editor/viewer and SMILES/SMARTS generator in JavaScript
- ACD/ChemSketch Archived 2006-10-18 at the Wayback Machine.
- Marvin Archived 2007-11-07 at the Wayback Machine. by ChemAxon – online chemical editor/viewer and SMILES generator/converter
- Instant JChem Archived 2007-11-12 at the Wayback Machine. by ChemAxon – desktop application for storing/generating/converting/visualizing/searching SMILES structures, particularly batch processing; personal edition free
- JChem for Excel Archived 2010-02-03 at the Wayback Machine. by ChemAxon – MS Excel add-in for storing/generating/converting/visualizing/searching SMILES structures
- Smormo-Ed – a molecule editor for Linux which can read and write SMILES
- InChI.info – an unofficial InChI website featuring on-line converter from InChI and SMILES to molecular drawings
- Balloon – A free program for 3D coordinate generation and conformational analysis.
- Indigo Archived 2015-02-11 at the Wayback Machine. – an open-source cross-platform cheminformatics library with a plugin for IUPAC-compliant molecule and reaction 2D structural formula rendering.
- Open Babel – an open-source chemical toolbox allowing anyone to search, convert, analyze, or store biochemical data.
- Bioclipse Archived 2010-01-11 at the Wayback Machine. – a free and open source workbench for the life sciences
- MolEngine Archived 2019-09-15 at the Wayback Machine. – A .NET cheminformatics toolkit to read/write SMILES, generate 2D coordinate from SMILES, and convert SMILES from/into other Chemical file formats.
- JSDraw Archived 2011-07-17 at the Wayback Machine. – A cross-platform javascript chemical structure editor to generate SMILES and SMARTS.