{"id":7069,"date":"2025-06-11T18:45:31","date_gmt":"2025-06-11T16:45:31","guid":{"rendered":"https:\/\/spgoo.org\/?page_id=7069"},"modified":"2025-06-16T14:12:45","modified_gmt":"2025-06-16T12:12:45","slug":"amelioration-de-morgangen","status":"publish","type":"page","link":"https:\/\/spgoo.org\/?page_id=7069","title":{"rendered":"Am\u00e9lioration de MorganGen"},"content":{"rendered":"\n<p>Au sein du centre de recherche d&#8217;IBM en Ireland, un <a href=\"https:\/\/research.ibm.com\/publications\/morgangen-generative-modeling-of-smiles-using-morgan-fingerprint-features\">projet de passage entre deux repr\u00e9sentations de mol\u00e9cules<\/a> \u00e0 \u00e9t\u00e9 r\u00e9alis\u00e9 avec en entr\u00e9e des &#8220;fingerprints&#8221; de Morgan et en sortie des smiles. Les descripteurs de Morgan indiquent quelles sous-structures sont obtenues en partant de chaque atome et en allant jusqu&#8217;\u00e0 une distance de 2 ( par exemple) de celui-ci. Etant donn\u00e9 la multitude de possibilit\u00e9s, il n&#8217;est pas possible de r\u00e9sumer cela simplement et par cons\u00e9quent ces informations subissent un hashage pour \u00eatre compress\u00e9es en un nombre r\u00e9duit de bits, souvent 2048. En ce qui concerne les smiles, il s&#8217;agit de la m\u00e9thode la plus classique pour coder la structure d&#8217;une mol\u00e9cule. Le passage entre ces deux formes de repr\u00e9sentation n&#8217;est pas \u00e9vident \u00e0 cause du hashing.<\/p>\n\n\n\n<p>Le probl\u00e8me li\u00e9 aux fingerprints, vient du fait qu&#8217;ils indiquent la pr\u00e9sence ou non d&#8217;une sous-structure, mais n&#8217;indiquent pas le nombre de fois qu&#8217;elle est r\u00e9p\u00e9t\u00e9e au sein d&#8217;une mol\u00e9cule.<\/p>\n\n\n\n<div class=\"wp-block-media-text is-stacked-on-mobile\"><figure class=\"wp-block-media-text__media\"><img loading=\"lazy\" decoding=\"async\" width=\"524\" height=\"718\" src=\"https:\/\/spgoo.org\/wp-content\/uploads\/2025\/06\/image-3.png\" alt=\"\" class=\"wp-image-7099 size-full\" srcset=\"https:\/\/spgoo.org\/wp-content\/uploads\/2025\/06\/image-3.png 524w, https:\/\/spgoo.org\/wp-content\/uploads\/2025\/06\/image-3-219x300.png 219w\" sizes=\"auto, (max-width: 524px) 100vw, 524px\" \/><\/figure><div class=\"wp-block-media-text__content\">\n<p>Les deux mol\u00e9cules ci-contre ont le m\u00eame fingerprint de Morgan pour un rayon de 2.<\/p>\n<\/div><\/div>\n\n\n\n<p>Ainsi, l&#8217;outil d\u00e9velopp\u00e9 par l&#8217;\u00e9quipe d&#8217;IBM a forc\u00e9ment eu du mal \u00e0 apprendre combien de fois il doit g\u00e9n\u00e9rer une sous-structure donn\u00e9e \u00e0 partir d&#8217;un fingerprint de Morgan qui doit correspondre \u00e0 diff\u00e9rents smiles !<\/p>\n\n\n\n<div class=\"wp-block-media-text is-stacked-on-mobile\"><figure class=\"wp-block-media-text__media\"><img loading=\"lazy\" decoding=\"async\" width=\"504\" height=\"771\" src=\"https:\/\/spgoo.org\/wp-content\/uploads\/2025\/06\/image-1.png\" alt=\"\" class=\"wp-image-7070 size-full\" srcset=\"https:\/\/spgoo.org\/wp-content\/uploads\/2025\/06\/image-1.png 504w, https:\/\/spgoo.org\/wp-content\/uploads\/2025\/06\/image-1-196x300.png 196w\" sizes=\"auto, (max-width: 504px) 100vw, 504px\" \/><\/figure><div class=\"wp-block-media-text__content\">\n<p>Dans l&#8217;exemple ci-contre issu du <a href=\"https:\/\/huggingface.co\/lamthuy\/MorganGen\/blob\/main\/Example.ipynb\">notebook associ\u00e9 <\/a>au projet, en partant de la mol\u00e9cule du haut, l&#8217;outil g\u00e9n\u00e8re la mol\u00e9cule du bas car il ne sait pas combien d&#8217;atomes il doit ajouter.<\/p>\n<\/div><\/div>\n\n\n\n<p>Pour r\u00e9soudre en partie ce probl\u00e8me, il faudrait agrandir le fingerprint en y ajoutant une partie li\u00e9e au nombre d&#8217;atomes de chaque type. Pour cela, il faudrait utiliser par exemple 50 bits pour indiquer le nombre les carbones aliphatiques, 50 pour le nombre de carbones aromatique, 25 pour les atomes d&#8217;oxyg\u00e8ne sp3, 25 pour les atomes d&#8217;oxyg\u00e8ne sp2, 25 pour les atomes d&#8217;azote sp3, 25 pour les atomes d&#8217;azote sp2, 25 pour les atomes d&#8217;azote sp, 10 pour les atomes de S sp3, 10 pour les atomes de S spd, 10 pour les atome de P spd, 10 pour chaque atome d&#8217;halog\u00e8ne. A chaque la position d&#8217;un 1 indiquera le nombre d&#8217;un type d&#8217;atome. Ce vecteur pourrait \u00eatre \u00e9galement hash\u00e9.<\/p>\n\n\n\n<p>En ajoutant une partie d\u00e9di\u00e9e au nombre d&#8217;atomes, il est possible d&#8217;ajouter l&#8217;information manquante pour que le syst\u00e8me puisse apprendre. <\/p>\n\n\n\n<div class=\"wp-block-media-text is-stacked-on-mobile\" style=\"grid-template-columns:25% auto\"><figure class=\"wp-block-media-text__media\"><img loading=\"lazy\" decoding=\"async\" width=\"169\" height=\"316\" src=\"https:\/\/spgoo.org\/wp-content\/uploads\/2025\/06\/image-5.png\" alt=\"\" class=\"wp-image-7101 size-full\" srcset=\"https:\/\/spgoo.org\/wp-content\/uploads\/2025\/06\/image-5.png 169w, https:\/\/spgoo.org\/wp-content\/uploads\/2025\/06\/image-5-160x300.png 160w\" sizes=\"auto, (max-width: 169px) 100vw, 169px\" \/><\/figure><div class=\"wp-block-media-text__content\">\n<p>Position du d\u00e9but de codage pour le nombre d&#8217;atome d&#8217;un type donn\u00e9.<\/p>\n<\/div><\/div>\n","protected":false},"excerpt":{"rendered":"<p>Au sein du centre de recherche d&#8217;IBM en Ireland, un projet de passage entre deux repr\u00e9sentations de mol\u00e9cules \u00e0 \u00e9t\u00e9 r\u00e9alis\u00e9 avec en entr\u00e9e des &#8220;fingerprints&#8221; de Morgan et en sortie des smiles. Les descripteurs de Morgan indiquent quelles sous-structures sont obtenues en partant de chaque atome et en allant jusqu&#8217;\u00e0 une distance de 2 [&hellip;]<\/p>\n","protected":false},"author":4,"featured_media":0,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"footnotes":""},"class_list":["post-7069","page","type-page","status-publish","hentry"],"_links":{"self":[{"href":"https:\/\/spgoo.org\/index.php?rest_route=\/wp\/v2\/pages\/7069","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/spgoo.org\/index.php?rest_route=\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/spgoo.org\/index.php?rest_route=\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/spgoo.org\/index.php?rest_route=\/wp\/v2\/users\/4"}],"replies":[{"embeddable":true,"href":"https:\/\/spgoo.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=7069"}],"version-history":[{"count":6,"href":"https:\/\/spgoo.org\/index.php?rest_route=\/wp\/v2\/pages\/7069\/revisions"}],"predecessor-version":[{"id":7105,"href":"https:\/\/spgoo.org\/index.php?rest_route=\/wp\/v2\/pages\/7069\/revisions\/7105"}],"wp:attachment":[{"href":"https:\/\/spgoo.org\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=7069"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}