Synbio, Bioengineering, Bioinfomatics関連の研究について書いたりするかもしれません。

MENU

合成生物学論文メモ (Nov 2022)

読み流した論文のメモ。黒色はメモ、緑色は感想、赤色は特に面白いと思ったもの。23報

Synthetic Biology

Cell-free / Reconstruction

無細胞系、再構成など
MS2ファージのウイルス様構造体(VLP)について、全ての一残基置換データを集めた適応度地形を元にVLP表面の正電荷を増加させる変異をデザインし、細胞内への取り込み効率をWTと比較して67倍向上させた。作成した変異体はエンドサイトーシスを阻害する複数の条件下でも高い取り込み効率を示した他、抗生物質(MMAE)の効果の向上にも応用出来た。

Optogenetics

光駆動型ツール、蛍光イメージング、光受容体など、その他〇〇genetics系
sfGFPをテンプレートにした段階的な変異導入により、既知の蛍光タンパク質では最も発光波長の短いSumire(ex: 343nm, em: 414nm)を開発した。また、SumireとT-sapphire(ex: 399nm, em: 511nm)がFRETペアとして有効な事を示した。
発色団周りの変異導入ステップが丁寧。
sfGFPやmGreenLantern(mGL)よりも更に化学的に安定な蛍光タンパク質hyperfolder YFP(hfYFP)を作成した。グアニジンやOsO4条件下でも蛍光活性を保ち、タンパク質精製や電子-蛍光顕微鏡サンプルでの有用性を示した。結晶構造を元に蛍光活性部位に変異を導入する事で同様に安定なGFP(LSSmGFP)も得られ、工学的なテンプレートとしての有用性も示した。
比較のグラフが一つだけ異次元で笑ってしまった。

Protein Engineering

タンパク質工学
E.coliのリンゴ酸酵素を対象に、配列を元に補因子(NAD+ or NADP+)の嗜好性を予測するロジスティック回帰モデルを構築し、予測を元にデザインした変異体で実際に嗜好性が変化することを実証した。
そもそものモデルの予測精度がかなり高いので、他のタンパク質の転用できるかどうかは配列データや予測の難易度次第な気もする。
アデニン編集酵素TadA-8eにPACE(Phage-assisted Continuous Evolution)をかけてシトシン嗜好性を向上させ、既知のシトシン編集酵素と同等以上の編集効率と低いオフターゲット活性を持つ変異体を作成した。アデニン編集酵素の内、シチジンデアミナーゼとの進化的関連性のあるTadAをテンプレートに選んだ上で、PACEではT7ポリメラーゼに停止コドンを導入する様なgRNAとSpCas9を加えて選別を行なった。
不活性な変異体を見れないのが難点ではあるが、Continuous directed evolution強い。Non-continuous版とも並行して実験していて一部の変異は両方で見られている。
  • Re-engineering the adenine deaminase TadA-8e for efficient and specific CRISPR-based cytosine base editing
  • Authors: Chen, Liang; Zhu, Biyun; Ru, Gaomeng; Meng, Haowei; Yan, Yongchang; Hong, Mengjia; Zhang, Dan; Luan, Changming; Zhang, Shun; Wu, Hao; Gao, Hongyi; Bai, Sijia; Li, Changqing; Ding, Ruoyi; Xue, Niannian; Lei, Zhixin; Chen, Yuting; Guan, Yuting; Siwko, Stefan; Cheng, Yiyun; Song, Gaojie; Wang, Liren; Yi, Chengqi; Liu, Mingyao; Li, Dali
  • Journal: Nature biotechnology
  • Year: 2022
  • DOI: 10.1038/s41587-022-01532-7
  • Institution: East China Normal University, China
TadA-8eに対して活性部位の構造を元に変異箇所を決めて変異スクリーニングを行い、高活性かつ低オフターゲットなシトシン編集酵素を作成した。
構造ベースとdirected evolutionで同じ変異と違う変異が両方あって面白い。
  • Computationally designed GPCR quaternary structures bias signaling pathway activation
  • Authors: Paradis, Justine S; Feng, Xiang; Murat, Brigitte; Jefferson, Robert E; Sokrat, Badr; Szpakowska, Martyna; Hogue, Mireille; Bergkamp, Nick D; Heydenreich, Franziska M; Smit, Martine J; Chevign{\'e}, Andy; Bouvier, Michel; Barth, Patrick
  • Journal: Nature communications
  • Year: 2022
  • DOI: 10.1038/s41467-022-34382-7
  • Institution: Université de Montréal, Canada
モカイン受容体であるCXCR4を対象に、RosettaMembraneによるSASA計算を元に変異体をデザインした。CXCR4はリガンドの結合状態によって異なるホモダイマーを形成するため、変異導入によるモノマーの安定性を損なわずに異なるホモダイマーの安定性を向上させるデザインをMCサンプリングで探索した。実証実験として二量体形成、Gタンパク質複合体形成、cAMP量上昇、β-arrestinによる細胞内シグナル誘導をそれぞれBRETセンサーで確認した。
膜タンパクでかつコンフォメーションも複数あって中々難しそう。
DNAバーコードを共有結合させたペプチド配列のスクリーニングを利用して、対象のタンパク質における抗体のエピトープをハイスループットに検出する系を確立した。

CRISPR/Cas

クリスパー系
公園の水サンプルでのメタゲノムシーケンスから新たなtypeII-CのCas9(EHCas9)を同定し、原核細胞と真核細胞の両方で遺伝子編集機能(PAM配列:NGG)を持つことを示した。
CRISPR-associated protease(CASP)の一つであるCsx29のエンドペプチダーゼ活性の構造・機能を解明し、Cas7-11-Csx29複合体を介した間接的な転写制御を可能にした。変異導入による活性解析や結晶構造解析に基づいて解明された機能によれば、Csx29はCas7-11、crRNA、標的RNAと複合体を形成して活性化する事でCsx30のリンカーペプチドを分解し、σ-factor(RpoE)抑制能をもつCsx30の不活化により転写を活性化する。また、標的RNAの分解はCas7-11のヌクレアーゼ活性によるものであり、Csx30ペプチドの分解の必要条件では無いことも分かった。全体のDiCASPシステムの応用として、Csx30の蛍光標識による標的RNA検出や、Csx30ペプチドを介して細胞膜に隔離したCreリコンビナーゼをcrRNAの添加(Csx29のペプチダーゼ活性ON)により遊離させて核内ではたらかせる系を簡便に実装した。
実験量が多い上に、DiCASPの機能としても面白い&応用先が広そう。
Cas7-11-crRNA-Csx29複合体について標的RNAあり/なしの場合の結晶構造解析を行い、標的RNAの結合によってCsx29のペプチダーゼ活性部位の取り得る構造空間が増加する事を示した。また、Csx29ペプチダーゼ活性の標的であるCsx30がE.coliに細胞毒性を持つ事を示し、Csx30がCsx31およびσファクター(RpoE)との複合体形成を介して転写抑制を行う事を示唆した。
もう一方のScienceと同時に出た論文。構造や生化学活性の示唆を与えている。
PAM配列の要求が少なくなるようにデザインされた5種類のSpCas9変異体について、E.coliにおけるCRISPRa誘導への適応可能性を検証した。sgRNAにMS2ヘアピン構造を組み込んだCRISPRaを用いて人工的なプロモーターを対象に検証すると、いずれのSpCas9変異体も哺乳類細胞に近いPAM嗜好性を示した。一方で、CRISPRiへの応用ではPAMの要求が緩いほど抑制効果が弱くなることも分かった。
SpCas9以外についても知りたいところ。

Cell / Tissue Engineering

細胞設計、組織工学など
CARの細胞内シグナルドメインについてドメインシャッフリングを行い、高い腫瘍攻撃性やT細胞形質の異なるCAR-T細胞を作成した。ドメインシャッフリングでは15種類のドメインA(チロシン活性化モチーフなし)とウイルス由来の細胞内シグナルを含む12種類のドメインB(チロシン活性化モチーフあり)を使用した。腫瘍細胞との共培養後にscRNA-seq解析を行うと、発現パターンの異なるクラスタが形成された。発現パターンを元に選定した10種類のCAR候補について、腫瘍攻撃性やサイトカイン分泌能の詳細な定量化を行うと既知のCAR-Tと比較して異なる性能を示す変異体を多く得られた事が確認された。
結合親和性の高いタンパク質ペア(SpyCatcher/SpyTag, CL7/lm7)を細胞表面に発現させたS. cerevisiaeを、誘電泳動を用いてゲル(PEG diacrylate)中に整列させる事で、遺伝的に操作可能なバイオポリマーを提案した。結合タンパク質を発現させた細胞間の結合力を光ピンセットで定量し、また、光ピンセットで二つの細胞を集めてシードを形成する事で細胞凝集を誘導できる事を示した。バイオポリマーの応用例として、SpyCatcher/SpyTagにウラン結合タンパク(Super Uranyl binding protein)を繋げることによるウラン回収や、ムール貝足タンパク(mussel foot protein)を用いた水中での粘着力の強化を行なった。
PEGが必要ではあるが細胞凝集を整列させるアイデアが面白かった。
哺乳類細胞の膜表面タンパク質局在を人工的に誘導可能な液液相分離(LLPS)によって制御する機能を実装した。高濃度条件下でLLPSが見られるSUM*5, SIM*6と膜貫通ドメイン(TM from EGFR)、ヘテロ結合タンパク質ペア(PDZ/PV, FKBP/FRB)をそれぞれ繋げることで細胞膜上での局在を可能にした。また、内在性の膜表面タンパク質に対するリガンド(R4L, mEGF, TRAIL)やナノボディをSUM*5またはSIM*6と繋げることで、それぞれの内在性タンパク質周辺にLLPSを誘導することが出来た。特にmEGFを用いてDR5を標的にしたLLPSでは、下流のアポトシースを誘導する事も出来た。設計したシステムを用いてORゲートやANDゲート的に局在を誘導する系や、別のLLPSタンパク質であるPRM*5とSH3*5との直交性のあるLLPS誘導を行う系も開発した。
実験量がすごい。細胞接着関連のタンパク質とも組み合わせられたりすると工学的なレイヤーが増えて更に面白そう。

Alternative Hosts / Strain Engineering

宿主や系統株の開発
LeTx毒素はヒト細胞のanthrax toxin receptor 2(ANTXR2)を介して細胞内に侵入し、MAPK分解により炭疽症状を引き起こす。ANTXR2遺伝子のプロモーターを対象にdCas9-DNMT3Aによるメチル化を導入する事でANTXR2発現量を低下させ、LeTxに対する感受性を下げる事に成功した。また、dCas9-KRAB-MeCP2による発現抑制でも同様の効果が得られた。
抗生物質耐性菌のメカニズムを埋め込んでいる様な感じで面白かった。論文で空軍研究所はじめて見た。

Computational Biology / Bioinformatics

Representation Learning

核酸アミノ酸配列の表現学習
8-50アミノ酸のペプチドに特化した表現学習におけるデータ水増し方法として、既知のタンパク質の部分列を用いる手法を提案した。ESM1bと同様にUniRef50の各クラスタの代表的な配列を事前学習データとして使用してMLMを解かせた(PeptMLM)。その他の事前学習タスクとしてはBLOSUMによる置換ベクトルとのKLdivの最小化(PeptBMLM)、元のタンパク質における次の配列の予測(PeptNPP)、PeptNPPでコサイン距離による損失を用いた学習(PeptCNPP)も導入した。
応用の結果を見ると単純に長さを制限してMLMを解く恩恵が大きそう。

Generative Model

生成モデル
小分子化合物生成に有効な事が分かっているグラフベースの自己回帰モデル(GraphINVERSE)を強化学習の中に組み込み、PROTAC生成のための最適化を行なった。初めにデータベース(protac-db)中の4120分子を用いてGraphINVERSEの事前学習を行い、事前学習済みモデルの出力表現を強化学習エージェントの入力とした。生成配列のスコアリングには訓練したLightGBMによる標的タンパク質分解スコア、生成化合物の多様性スコア、対数尤度を用いた。
抗体の配列でBERTの事前学習を行い、事前学習済みモデル(AbBERT)の埋め込みを用いて配列と構造それぞれを考慮した階層的なmessage passing(HMP)により生成を行なった。事前学習では重鎖のみをデータに使用したMLMによる学習を行い、相補性決定領域のみをマスキングの対象とするバイアスをかけた。HMPではRBFカーネルを用いた原子エンコーディングとCαに注目した残基エンコーディングとをそれぞれ行い、AbBERTは新たに追加した学習用トークンのみにbackpropをかけるprefix tuningを行なった。
デザイン対象ごとにBERTの事前学習をする様な流れがくると、計算量も多くなっていよいよドメイン知識の応用の仕方が問われそう。
VAEとGAを用いた化合物生成モデルにおいて、生成ステップの途中で潜在空間を動的に変化させることによってsample-efficientな探索を行うモデルを提案した。生成時の学習では 1)JT-VAEにおける再構成誤差 2)各目標タスクごとに設定するMLPの予測誤差 3)化合物の2ビット表現をMLPで予測したもののcross entropy の3つの損失の重み付き和を全体のロスとして設定した。2)の損失では目標ごとのMLPの予測値を外部のoracleとの誤差が少なくなる様に訓練した。
MLPで明示的に潜在空間を変形させるのは損失関数の設計が中々難しそう。

Deep Learning

深層学習を使ったバイオインフォ系のタスク
タンパク質の多量体における距離行列を予測するモデルCDPredを提案した。入力情報としてモノマーの結晶構造から抽出した距離行列、PSSM、MSAtransformerのattention map、CCMpredによる共進化スコア行列を使用した、構造には2DattentionとResNetを用いた。既存のデータセットに対して、AF2-multimerでは予測が難しい構造について高い予測精度を示した。
変異体デザインなんかには良さそう。
タンパク質構造において隠れ状態を定義して遷移動態を計算する深層学習モデル(VAMPnet)に、ドメインごとの分割機能を付与して各ドメインについて独立の動態シミュレーションを可能にした(iVAMPnet)。iVAMPnetせは入力後の第一層で学習可能なマスキング行列とのattentionを計算することでドメインの分割を行い、各分割ごとに個別の動態計算を行う。損失関数は真のダイナミクスとの誤差と各ドメイン間の関連性を低下させる様に設計した。
ドメイン数を明示的に与える必要があるのが難しいところ。

Biology in general

致死性の遺伝子マーカー(sacB)に対するCRISPRiを用いて、雑多なライブラリから目的のゲノムを回収する手法: CRISPR counter-selection interruption circuit(CCIC)を開発した。CCICではλファージによるプラスミドへのゲノム挿入を行なった後、sacB+CRISPRiによるプラスミドの選別、シーケンシングによる各プラスミドに載せた24塩基のバーコード配列(dCasのターゲットでもある)の同定を行う。土壌サンプルのメタゲノムを対象に、ランダムに選択したゲノムを回収する実験では最大で20,000サンプルの中から目的のゲノムを回収する事が出来た。実用例として、ゲノムの解析後にファージへの免疫に関わるgene clusterを含むと予測されたゲノム66種を回収する際には、わずか2日間の実験で95%のゲノムを回収出来た。
分野は遠かったが面白かった。メタゲノム解析と同定が進めばゲノムマイニングやMLモデルの訓練で扱えるの対象も増えて助かる。

合成生物学論文メモ (Oct 2022)

読み流した論文のメモ。黒色はメモ、緑色は感想、赤色は特に面白いと思ったもの。12報。

Synthetic Biology

Transcription/Translation Control

遺伝子回路、転写翻訳制御など
E.coliで開発されたsplit T7ポリメラーゼをS.cerevisiaeに導入しポリメラーゼとdCas9アクティベーターから成るANDゲートを実装した。また、直交性を持つ二種類のT7ポリメラーゼ変異体(cgg, PM)を用いてNOR/ORゲートを実装した。実装段階ではGalactose応答性のTF(Gal1)と銅イオン応答性のTF(CU1)を用いていたが、青色光応答性の人工TFにCRY2とCIB1-VP16を用いても回路設計が可能であり、T7ベースの回路のモジュール性を示した。

Cell-free / Reconstruction

無細胞系、再構成など
細胞透過性ペプチド(PepI, penetratin)を用いてタンパク質を人工脂質膜(GUV)内に運搬する技術を開発し、GUV中の生化学反応を制御することを可能にした。GUVに用いる脂質の種類(DOPC, DOPG)や比率の調整後、応用例としてDNaseIによる分解反応とStreptavidin添加によるアクチンネットワーク形成の誘導を実証した。
細胞透過ペプチド以外にも細胞膜と物理的に相互作用する機能をGUVで試せそう。

Optogenetics

光駆動型ツール、蛍光イメージング、光受容体など、その他〇〇genetics系
光応答性のタンパク質核外輸送ツール(LEXY)について、局在制御に関わる変異体の哺乳類細胞でのキャラクタリゼーションを行なった。LEXYは青色光受容体(AsLOV2)と核内/核外輸送シグナルから成り、LOVドメイン部分の変異によって光照射時だけでなく暗条件下でも細胞質局在の割合が上昇した。
定常状態の局在度合いについては、輸送シグナルの配列組成でも制御出来そう。

Protein Engineering

タンパク質工学
  • De novo design of immunoglobulin-like domains
  • Authors: Chidyausiku, Tamuka M; Mendes, Soraia R; Klima, Jason C; Nadal, Marta; Eckhard, Ulrich; Roel-Touris, Jorge; Houliston, Scott; Guevara, Tibisay; Haddox, Hugh K; Moyer, Adam; Arrowsmith, Cheryl H; Gomis-R{\u}th, F Xavier; Baker, David; Marcos, Enrique
  • Journal: Nature communications
  • Year: 2022
  • DOI: 10.1038/s41467-022-33004-6
  • Institution: University of Washington, USA
Ig様の構造をde novoデザインして、機能および構造について実験による実証を行った。Igにおいては2つのクロスβシートが折り畳みの律速となる事から、取り得る16種類(各クロスβ: 4^2)のモチーフについてRosettaのfolding simulationにより構造の制約を検証した。同定した制約条件を元にRosettaの構造サンプリング、配列デザインを行い、構造予測(RosettaFold, AlphaFold)が正しく行われた31デザインを実証実験に回した。E.coliで発現させた各配列の精製を行い、8つのデザインで親水性と単分散性が、内7つで熱安定性(Tm>90℃)が確認された。
職人芸っぽい

CRISPR/Cas

クリスパー系
Cas12aの活性のリードアウトにG4を形成して蛍光プローブと結合するDNAzymeを用いて、配列検出系を作成した。標的の配列と複合体形成したCas12aがG4 DNAzymeの補鎖となるブロッカーDNAを切断する事で、DNAzymeが蛍光を示す仕組み。化学的に蛍光DNAプローブを用いる検出系と比較して培養細胞で5倍の感度を達成し、生体マウスでは2週間近く早い段階での感染検出が可能となった。
G4部分が配列レベルで調整されていて面白かった。

DNA / Biophysics

DNA、核酸論理回路、ナノスケール構造物など
オリゴマーとしてキャプシド構造体を形成するencapsulinに非特異的なDNA結合性ペプチド(E.coliのDpsタンパク質N末端配列)を遺伝的に接続し、RNA配列を取り込むキャプシドを作成した。異なる大きさのキャプシドを形成する3種類のencapsulin (TmT1, MxT3, QtT4)についてRNA内包変異体を作成し、キャプシドが内部のRNA配列をヌクレアーゼから保護することが出来ることを示した。MxT3について、特異的に結合するペプチドを付加したGFPを同時に発現させ、GFPRNAを共にキャプシド内に取り込むことが出来た。
オリゴマー形成自体を誘導可能な形にしたり出来ると、ヌクレアーゼに頑健な反応場を可逆的に制御できたりして面白そう。

Alternative Hosts / Strain Engineering

宿主や系統株の開発
ヒト細胞(HEK293)を用いて、感染性のアデノ様ウイルス(AAV)を安定的に発現可能な系統株を作成した。AAVゲノム、複製起点、キャプシド遺伝子群とをそれぞれ別々のプラスミドに載せ、異なるプロモーターで制御する事で、AAVの生成量を調整可能にした。古典的な形質転換と比較すると感染効率は低い結果となったが、安定発現系によるスケール可能性を示した。
プロモーターやプラスミドの配列レベルでの設計や、長期の安定発現可能性など、色々改善出来そう。
Split蛍光タンパク質(mVenus)を媒介として、植物細胞内での葉緑体の凝集システムを実装した。βシート2枚を除去したmVenusと、除去したβシート部分とをそれぞれ別のプラスミドに載せて発現させる、プラスミドの混合比率を変える事で凝集度合いを変化させることができた。
植物細胞での発現難易度が分からないが、E.coli等で使われる誘導性のヘテロ結合ツールも応用出来そう。split-mVenusだとツールとしては凝集が起きないと観察ができなくなってしまうのが扱いづらい気がした。
種々の細菌をHeLa細胞の細胞質に物理的に注入する実験から、E.coliがHeLa細胞内部で生育可能な事を示した。元のK-12(ΔtyrA)株は生育速度が早過ぎて1-2時間でホストの細胞死を招いてしまったが、アミノ酸要求条件を更に厳しくする事で生育速度を下げると、最大6時間ほどまで寄生を続けさせることができた。
発想はシンプルだが面白かった。

Computational Biology / Bioinformatics

Representation Learning

核酸アミノ酸配列の表現学習
データベース中の機能未知遺伝子にを対象に、word2vecによる潜在表現を用いて遺伝子の機能予測を行なった。NCBIとEBI上の遺伝子に対して配列を元にクラスタリングするとKEGGアノテーションが利用可能な遺伝子ファミリーは全体の20%となった。機能未知遺伝子に対して、word2vec+MLP(4層)で学習したモデルを使って機能予測を行なった。
予測の域を出ないので実証が難しそう。データベースの古いバージョンの情報で訓練したモデルで最近のアノテーションが予測できる、的な事が出来れば検証にはなるかも?
事前学習済みBERTとrecurrent geometry network(RGN)を組み合わせて、MSAに頼らずに高速にタンパク質構造予測を行うモデルRGN2を開発した。UniParcデータを用いてBERTの事前学習を行い、得られた潜在表現を入力にしてRGNを学習させた。RGN2はMSAを用いるモデルと比較して全般的な予測精度は低いものの、MSA作成が難しい配列に対する予測精度は高い他、高速な予測が可能。

Deep Learning

深層学習を使ったバイオインフォ系のタスク
ProtBERTを元にしてAlphaFoldの蒸留を行ない、軽量化モデルを用いてInverse Foldingにおける生成配列の構造評価を可能にした。軽量化後のモデルはAlphaFoldと比較して10^4早くなった。構造評価のためAlphaFoldにおいて訓練時の評価指標に使われたTM(αCの平均距離)とLDDT(局所構造における原子間距離)の予測値を直接用いたが、これらのスコアによる正則化は他の生成モデル(Graph Transformer, Protein Infilling)でも有効だった。

合成生物学論文メモ (Jul 2022)

読み流した論文のメモ。黒色はメモ、緑色は感想、赤色は特に面白いと思ったもの。19報。

Synthetic Biology

Transcription/Translation Control

遺伝子回路、転写翻訳制御など
E.coliにおいてRBSの一部(spacer region: -7~-2, SDの一部: -17~-12)を対象に~20,000の変異体を作成してスクリーニングした。CDSGFPRFPを使用したそれぞれの場合で蛍光量の相関が高いものをLCD(low context-dependence)配列として同定し、解析およびその他のCDS(GFP上流に他のタンパクのN末端36ntを繋げたもの)での発現量の定量を行なった。部位としてはspacer regionはコンテクスト依存性が低く、特にAC-richな場合は異なるCDS間での相関係数が0.714となった。
GFP発現量の比較が難しいからだとは思うが、36ntの付加でCDSの異なるコンテクストとして妥当かは少し疑問。
シアノバクテリア(S. elongatus)においてAHLに反応する遺伝子回路を組み込み、E.coliからのAHL発現をシグナルとして遺伝子発現を行うQSシステムを実装した。3種類のTF(LuxR, TraR, LasR)についてS.elongatus, E.coliそれぞれで反応曲線を定量すると、いずれのTF回路についてもE.coliでのOFF状態での発現量(basal expression)はS.elongatesよりも低かったが、その他の傾向については細かい違いはあったものの概ね一致した。共培養系でE.coliのAHL発現を誘導すると、S.elongatusからの蛍光タンパク質(mNeonGreen)発現量や光合成を介したスクロースの産生量を増加させる事が出来た。
OFFの時の発現漏れは他のシステムの導入で工夫出来そう。

Cell-free / Reconstruction

無細胞系、再構成など
ウィルス様キャプシドによる酵素リアクターの作成において、酵素の種類によってキャプシドタンパクの長さや酵素との混合割合の最適化が必要である。最適化の手間を解決するため、P22バクテリオファージ由来のキャプシドタンパクの長さや酵素との接続有無を変えた6種類のプラスミドを作成し、簡便に検証できる系を開発した。YFPと3種類のMK(mevalonate kinase)で最適化の実証を行った。

Optogenetics

光駆動型ツール、蛍光イメージング、光受容体など、その他〇〇genetics系
青色光照射によってミトコンドリアの分裂を促進するシステムを実装した。CRY2/CIBをそれぞれミトコンドリア膜結合タンパク(TOM20)およびリソソーム結合タンパク(LAMP)と繋げ、光照射時のCRY2/CIB結合によってリソソームをミトコンドリアリクルート可能にした。また、光照射(20min)で分裂したミトコンドリアは24hの暗条件によって再結合した。応用例として、ミトコンドリアが長くなり(hyperfused)好気呼吸機能が低下する変異体で分裂を促進すると、酸素消費速度とATP合成量が部分的に回復した。
ミトコンドリアの再結合の方のメカニズムは知らないが、こちらも誘導出来たら面白そう。

Protein Engineering

タンパク質工学
所望の立体構造を持つタンパク質をデザインするにあたって、既存手法でwet実測との乖離が起きやすかった問題点をモデルの工夫と問題の読み替えの2つのアプローチで改善した。BERTの入力としてはターゲット残基の周辺に配置されるアミノ酸の情報を用いて、ターゲット残基のアミノ酸、側鎖の配座、溶媒アクセシビリティ等のmultitask予測を事前学習として行なった。事前学習後のモデルを用いて、アミノ酸を段階的に配列が収束するまで変異を重ね、最終的な配列をデザイン配列とした。デザインした配列はRosettaによるエネルギー予測、AF2による構造予測と良く一致した他、wet実験で結晶構造解析を行なったものについても予測に近い構造が得られた。
事前学習法の工夫が面白かった。デザインの構造->配列ステップは続々と出てきている感じがある。
  • De novo design of protein homodimers containing tunable symmetric protein pockets
  • Authors: Hicks, Derrick R; Kennedy, Madison A; Thompson, Kirsten A; DeWitt, Michelle; Coventry, Brian; Kang, Alex; Bera, Asim K; Brunette, T J; Sankaran, Banumathi; Stoddard, Barry; Baker, David
  • Journal: Proceedings of the National Academy of Sciences of the United States of America
  • Year: 2022
  • DOI: 10.1073/pnas.2113400119
  • Institution: University of Washington, USA
2回回転対称なタンパク質オリゴマーをデザインする計算科学的手法を改善した。Rosettaモンテカルロサンプリングでは特定の構造モチーフを取得するのが難しかったが、配列がリピートする様な制約をかける事でこの点を解決した。デザインした101配列を対象とした実証実験では、44/101の構造で水溶性を、36/44の構造でヘリックス性(circular dichroism)を、31/36の構造でSAXS(small angle X-ray scattering)の結果が予測と近いプロファイルになる事をそれぞれ確認した。結晶構造を解いた2つのサンプルはデザインした通りの構造を取った。
デザインの各ステップが明快だった。水溶性の時点で大分サンプルが削れてしまったのでその点を考慮すればより良さそう。
  • Logic-gated antibody pairs that selectively act on cells co-expressing two antigens
  • Authors: Oostindie, Simone C; Rinaldi, Derek A; Zom, Gijs G; Wester, Michael J; Paulet, Desiree; Al-Tamimi, Kusai; van der Meijden, Els; Scheick, Jennifer R; Wilpshaar, Tessa; de Jong, Bart; Hoff-van den Broek, Marloes; Grattan, Rachel M; Oosterhoff, Janita J; Vignau, Julie; Verploegen, Sandra; Boross, Peter; Beurskens, Frank J; Lidke, Diane S; Schuurman, Janine; de Jong, Rob N
  • Journal: Nature biotechnology
  • Year: 2022
  • DOI: 10.1038/s41587-022-01384-1
  • Institution: Leiden University Medical Center, Netherlands
二種類のIgGが同時に結合する時のみオリゴマー形成が起こる様な論理ゲートを実装し、抗原への特異性を高めた。ホモ6量体を形成しにくいIgGのFcドメイン変異体(K439E, S440K)に対し、下流の免疫反応に必要なFcγR, C1qエフェクタとの結合を弱める変異(G236R, G237A)を新たに加えた。これによりエフェクタ存在下でのヘテロ6量体形成への嗜好性を向上させた。
二段階でオリゴマーの嗜好性を制御している点が面白かった。
Kemp eliminaseを対象に、酵素活性の変化をMaximum Entropy Modelで解析した。directed evolutionで得られた変異体ではモデルのスコアはk_catやk_cat/Kmと正の相関を示し、これは酵素活性と熱力学的な安定性とのトレードオフとして説明できる可能性がある。一方で活性部位から離れた残基の変異については負の相関を示した。
事前学習モデルがこれらの特徴をどれ位捉えられているか調べたら面白そう。酵素活性以外の特性にも当てはまるかは検証できると面白い。

CRISPR/Cas

クリスパー系
Cas1-Cas2インテグラーゼと逆転写されるncRNA(retron)の特性を利用して、同一細胞内の転写イベント時系列をCRISPR arrayとして物理的に記録する仕組みを開発した。初めにretronのCRISPR arrayへの組み込みを系として確立した後、同じCRISPR array中でも識別できる6種類の互いに直交なバーコード配列を設計した。システムのスペックを計測後、転写イベントをポアソン過程でモデル化してシミュレーションを行った。シミュレーションの結果、シーケンスリード数(~10^5)、転写イベント間の経過時間(~24h)、retronのシグナル強度が識別能に重要な事が分かった。
転写の計測に新たな次元が加わった感じで発展性がすごい。色々と最適化の余地はありそうなので期待。

Metabolic/Signal Pathway Engineering

シグナル経路、代謝経路、代謝酵素工学など
E.coliにおいてserotonin産生系を構築するにあたって、補因子であるBH4を細胞内で再生産する系の導入により産生量を向上させた。

DNA / Biophysics

DNA、核酸論理回路、ナノスケール構造物など
DNA折り紙を使って細胞表面に物理刺激をかける構造体: Nano-winchを作成した。パーツの配列長を変化させる事で物理刺激の肝となる部分の長さを変え、かかる圧力を調整した。また、DNAを後から加える事でパーツを変化させられる系も作成した。応用例として、物理刺激に反応するレセプターであるintegrinを活性化して下流のシグナルをONにする事が出来た。
シンプルにすごい。現状はコレステロールで細胞膜に接着させているが、nanobody等で特異性を持たせることも出来るかもしれないとのこと。

Alternative Hosts / Strain Engineering

宿主や系統株の開発
アグロバクテリウム(A. tumefaciens)の表面に抗体VHHを発現させることで、酵母や哺乳類細胞への細胞接着を促進し、ホスト細胞への感染効率を向上させた。初めにA. tumefaciensのautotransporter遺伝子を同定し、細胞外に表出する部分をVHHに置き換えてタンパク質提示を可能にした。実証として、split-Nanolucの小サブユニットをA.tumefaciensからHeLa細胞へ運搬させて発光を確認した。
autotransporterのデザインからするのが大変そう、面白かった。

Miscellany

その他
タンパク質相互作用を定量するyeast two-hybrid assayにおいて、affinityの高いレンジで解像度が低くなってしまう問題を、タンパク質発現量を調節する事で解決した。

Computational Biology / Bioinformatics

Representation Learning

核酸アミノ酸配列の表現学習
2階層のVQ-VAEを用いて細胞画像からタンパク質の局在に関与する特徴抽出を行うモデルCytoselfを作成した。自己教師あり学習では細胞画像の再構成を行い、VAEで得られた低次元ベクターからタンパク質ラベルの予測を行った。この時、外側のVAEの表現ベクター(25*25*64)をlocalな、内側VAEの表現ベクター(4*4*576)をglobalな特徴量とした。既存のモデルの分類性能を上回った他、低次元の埋め込みのプロファイルからラベル未知のタンパク質の局在部位を推察可能である事を示した。
階層的な表現学習は配列に対しても二次構造やIDR予測等で応用できそう。
事前学習済みのタンパク質生成モデルProtGPT2を作成した。生成配列の妥当性を評価するため、天然変性領域(IUPred3で予測)と二次構造(PSIPREDで予測)を天然配列と比べると各特徴が同等の割合で見られた。また、ホモロジー探索(HHblits)による比較をすると、全体の傾向(identity vs alignment length)としては天然配列と生成配列は近かったが、生成配列にはデータベース(UniClust30)を丸暗記しているような傾向は見られなかった。また、立体構造予測(Rosetta, MD simulation, AlphaFold)による比較では、全体の傾向は天然配列と近かった一方で、天然の配列には無いトポロジーが複数見つかった。
ドライ側では難しいが、今後の実証実験でどの程度の性能が出るか楽しみ。
バクテリアのメタゲノムデータから遺伝子クラスタ(BGC: biosynthesis gene cluster)を予測する言語モデルを作成した。モデル構造はByteNetとCNNを組み合わせた形で、Pfam embeddingを入力としてMLM(masked language modeling)による事前学習を行なった。MLMの予測精度自体はPfam embeddingをランダムにした場合とESM-1bの出力表現を用いた場合とで大きな差は無かったが、訓練後の潜在表現の分布はESM-1bを用いた方が遥かに良くファミリーごとのクラスタを形成した。事前学習直後のモデルではBGCの開始位置(AUC=0.720)と当該ドメインがBGCかどうか(AUC=0.876)を高精度で予測できた他、その後のfinetuningでは精度が向上した(AUC=0.941、ただし事前学習なしでもAUC=0.937)。
Fine-tuning後の性能が振るわなかったのは残念だが、事前学習後の性能が良いのでdiscussionにもある様にマイニングに良さそう。
抗コロナウィルス性ペプチドを予測するタスクにおいて、データセット特異的なword2vecを作成する事でSOTAを達成した。古典的なアミノ酸配列の埋め込み(one-hot, AAC, BLOSUM62など)とword2vecとを、幾つかのMLモデル(Transformer, BiLSTM, CNN, RF, SVM)と組み合わせたところ、word2vec+RFが最も良い精度だった。
データセットが小さいとやはり潜在表現を使う方向性の方が良さそう。タンパク質言語モデルの潜在表現は精度が出なかったのかは気になる。
タンパク質変異体のfitness予測を行うにあたって、GPT2に工夫を加えたモデルを事前学習し、SOTAを達成した。また、DMS(deep mutational scanning)データと予測タスク(置換データセットが87種類、indelデータセットが7種類)をまとめたライブラリProteinGymを作成した。モデル構造としては通常の1-merを処理するattention headと並列に3-mer, 5-mer, 7-merを畳み込んだものを扱うattention headを組み込み、k-mer特徴を明示的かつヘッド特異的に学習させた。データセットが1塩基置換に偏っている点には注意が必要とのこと。

Deep Learning

深層学習を使ったバイオインフォ系のタスク
MSAを使わずにタンパク質立体構造を予測するモデルを作成した。タンパク質言語モデルから取り出した配列潜在表現とattention mapを下流の立体構造予測部分(AF2のEvoformerとstructure modelingの派生)の入力として使った。MSAフリーのモデルとしてはSOTAを達成した他、一部のデータセットではMSAモデルに匹敵する精度を示した。また、入力配列長によるスケールはあるものの、短い(<800)配列ではAF2やRosettaFoldに比べて100-1000倍早い計算速度を達成した。

合成生物学論文メモ (Jun 2022)

読み流した論文のメモ。黒色はメモ、緑色は感想、赤色は特に面白いと思ったもの。

Synthetic Biology

Transcription/Translation Control

遺伝子回路、転写翻訳制御など
dCas9やdCpf1とTFを用いた転写調節において、SunTag(scFV/GCN4)やSpyTag/SpyCatcherなどの凝集システムを組み合わせる事で転写活性のON/OFF比を増大させた。また、dCas9とdCpf1とを個別に用いる事でで直交性を保った転写制御が可能だった。
パーツが増えてくると細胞の代謝負荷がどれくらいなのか気になる。
制御理論におけるPIコントローラーを哺乳類細胞(HEK293T)内の遺伝子回路で実装した。tTAの発現を中心として、I制御部分ではtTA自身のmRNAへのアンチセンス鎖発現促進によるネガティブフィードバックを利用した。P制御ではI制御よりも早いネガティブフィードバックを形成するため、tTAとL7Aeを同時に発現(P2Aで接続)させ、L7Aeに自身のmRNAを抑制させた。また、miRFPを異なる強度のプロモーターで発現させ、細胞内の代謝負荷に対するロバスト性も実証した。
とんでもない量の最適化をしていそう。シンプルにすごい。
E.coliのRBSデザインにおいて、ガウス過程回帰(獲得関数にはUCBを使用)を用いて450サンプルのみのwet実験で翻訳開始速度を34%向上した。
最大値は向上しているが集団としてはもう少しラウンド数が必要そう。

RNA Synthetic Biology

アプタマー、リボザイムなど
dCas9のsgRNAを含んだRNA折り紙の各部にMS2やPP7結合アプタマーを配置し、転写を調節するシステムを実装した。アプタマーの種類、数(1-4個)、配置によって転写誘導の強度が変化した。
RNA折り紙を使ったツール最近よく見る。
ランダムなライブラリからDNAの鏡面異性体アプタマーを選定、進化させるスクリーニング手法を開発した。L-DNA合成酵素(D-Dpo4-5m)とPAGEによるシーケンシングが手法の要。ヒトthrombinを対象に二段階の選定から得たアプタマーは同じ配列のL体と比べて血清やDNaseなる対して耐性を持った。
イデアも結果もかなり面白い。結構な数のPAGEシーケンシングで大変そう。

Cell-free / Reconstruction

無細胞系、再構成など
4文字コドン(UAGN, AGGN)を利用した非天然アミノ酸(Nε-(tert-butyloxycarbonyl)-L-lysine, K-alkyne, K-alkene)発現において、4文字コドン周辺の-3から+10配列を最適化する事で発現効率を大きく向上させた。通常のmRNAと比較して、UAGAでは48%、AGGAでは98%の発現量を達成した。
対応するtRNAやaaRS次第で可能性が広がりそうで面白い。

Optogenetics

光駆動型ツール、蛍光イメージング、光受容体など、その他〇〇genetics系
粘性タンパクであるMfp3(mussel foot protein 3)に、RRGドメインのリピート配列を付加する事で相分離液滴を作成し、液滴に対して二次的に制御を加える方法を実装した。親水性クロロフィルであるWSCPは赤色光を吸収して一重項酸素を生成する作用を持ち、WSCPを添加すると赤色光照射によって液滴内のMfp3が架橋されて液性が固化した。Mfp3-RRGは細胞(HEK293T)内でも液滴を形成し、WSCPと赤色光照射によって固化した。vitroで光ピンセットを用いることで、液滴一粒の固化も可能だった。また、Niを添加することで、遊離のHisタグ-タンパク(GFP, Caspase3)を液滴内にトラップすることが出来、WSCPと赤色光照射で液滴を固化する事で、Caspase3の基質が液滴に入り込むのを防ぐ事が出来た。
色々なシステムの実装をしていて盛り沢山だった。
E.coli において青色光誘導型のCreリコンビナーゼを用いて、抗生物質(kanamycin, carbenicillin, chloramphenicol, tetracycline)耐性をONにするシステムを実装した。
オプトジェネティックな制御を厳密にしたい場合は有効そう。でも代謝荷重を考えると抗生物質自体を光ケージで修飾する様な方が(あれば)使い勝手は良いのかも。

Protein Engineering

タンパク質工学
  • BacPROTACs mediate targeted protein degradation in bacteria
  • Authors: Morreale, Francesca E; Kleine, Stefan; Leodolter, Julia; Junker, Sabryna; Hoi, David M; Ovchinnikov, Stepan; Okun, Anastasia; Kley, Juliane; Kurzbauer, Robert; Junk, Lukas; Guha, Somraj; Podlesainski, David; Kazmaier, Uli; Boehmelt, Guido; Weinstabl, Harald; Rumpel, Klaus; Schmiedel, Volker M; Hartl, Markus; Haselbach, David; Meinhart, Anton; Kaiser, Markus; Clausen, Tim
  • Journal: Cell
  • Year: 2022
  • DOI: 10.1016/j.cell.2022.05.009
  • Institution: Reseaarch Institute of Molecular Pathology, Austria
B. subtilisのプロテアーゼであるClpCと分解ターゲットとなるタンパク質に結合し、ClpC/ClpPのオリゴマー形成とそれに伴うタンパク質分解を誘導する化合物BacPROTACを開発した。BacPROTAC-1はClpCに結合するpArgと分解ターゲットに結合するbiotinを繋いだ構造を持つ。各部を別の構造に置き換える事で、MycobacteriaのClpC1を対象にしたBacPROTAC-2~5も作成する事が出来た。
化学的なデザイン部分は良くわからないが、手順が面白かった。
二次構造を取るペプチドのブロックをIDRリンカーで接続し、細胞内でゲル状に凝集するシステムを実装した。4つのヘリックスからなり逆並行配置で自己組織化するペプチド(4HB: 4-helix bundle)と、5つのヘリックスからなり並行配置で自己組織化するペプチド(5HB: 5-helix bundle)とを使用した。E.coliでペプチドは極に凝集し、各パーツの配置によって凝集の様子が変化した。また、細胞質分裂を止めた変異体で凝集スポットが定間隔で観測されたことから、極への凝集は核様体に押し退けられて(nucleoid occlusion)起きている事が示唆された。
現象自体も面白かったし、細胞内反応の場を人工的に作れそう。
標的のペプチド(FusA)を切断して成熟させる機能を持つが構造未知のタンパク質:FusB2について、Lys置換によって機能に重要な残基を特定しつつ、AlphaFold2を用いた構造予測を組み合わせることで活性部位を特定した。
AF2の予測構造で十分な証拠として認められる様になってすごい。

DNA / Biophysics

DNA、核酸論理回路、ナノスケール構造物など
DNA折り紙において、二重鎖の副溝に結合してエンドヌクレアーゼを阻害する薬剤の利用法を開発した。薬剤添加により、DNA折り紙が壊れやすいマウス培養液中での構造の生存時間が3hから12hに伸びた他、単離のDNase I, IIに対して耐性を示した。また、既存手法であるHIV抗原付加と同時に使用可能で、B細胞への毒性も低かった。
光による異性化反応を利用して回転運動を起こすような化合物を開発し、回転運動によって細胞膜に侵入する抗生物質を実装した。
原子力顕微鏡で視認できる構造を取る3種類のDNA折り紙(ノード)とfranking regionのハイブリダイゼーション(エッジ)を利用して、グラフ理論における3色問題のwetでのシミュレーションを行なった。
グラフを作る発想は見た事がなかったので面白かったし、相性が良さそう。大規模にするには直交性の確保が大変そうではある。

Alternative Hosts / Strain Engineering

宿主や系統株の開発
非モデル生物の酵母Komagataella phaffiiにおいて、ゲノム変異スクリーニングで同定した変異を組み合わせた後に、方向性進化をかける事でリコンビナントタンパク質(anti-lysozyme scFv)の分泌量を大きく向上させた。
形質転換/ゲノム編集周りの難しさが解決できれば、手広くスクリーニングが進みそう。

Computational Biology / Bioinformatics

Representation Learning

核酸アミノ酸配列の表現学習
  • Generative aptamer discovery using RaptGen
  • Authors: Iwano, Natsuki; Adachi, Tatsuo; Aoki, Kazuteru; Nakamura, Yoshikazu; Hamada, Michiaki
  • Journal: Nature Computational Science
  • Year: 2022
  • DOI: 10.1038/s43588-022-00249-6
  • Institution: Waseda University, Japan
VAEのデコーダにpHMMを用いて、アプタマーを対象にしたSELEXデータの学習を行った結果、デコーダにpHMMを使用した事で部分列の特徴の分離が進んだ。実データへの応用として2次元の潜在空間に対してGMMを適用して配列生成を行なった。また、潜在空間におけるGMMのベイズ最適化を行い、実験的評価をするべき配列の提案をすると、結合性能の高い配列を効率良く同定できた。
Fungiのエフェクタータンパク質分類を解くに当たって、事前学習済みの言語モデル(BiLSTM, SSA, UniRep)から得られた潜在表現ベクトルをターゲットにGANを訓練してデータの水増しに利用した。
表現学習を広く使えそうな手法で面白い。
タンパク質の特徴(溶媒アクセシビリティ、二次構造、構造変性、バックボーンのdihedral angle)を予測するツールNetSurfP(web server + standalone)の高速化を行なった。従来のアルゴリズムで特徴抽出のためにMSAを計算していた部分を、事前学習済みのタンパク質BERT(ESM-1b)に置き換えた事で同等の精度を保ちつつ600倍ほどの高速化に成功した。
LSTM+RNNやVAEを用いて化合物の生成タスク(LogPスコア分布、複数モダリティを含むデータ、巨大な化合物のみのデータ)を解き、生成された化合物の特徴と訓練データとの類似度合いを比較した。LSTM+RNNモデルはいずれのデータでも訓練データ中の分布を種々の評価指標で良く捉えた。
評価が難しそうだが、大まかなアイデアとしては核酸やタンパク質でも出来るかも?巨大な化合物タスクが難しいかもしれないがBERTや事前学習済みモデルについても比較があれば面白そう。
タンパク質の相分離性の予測において、自己組織化による相分離タンパクと相互作用による相分離タンパクとをそれぞれ予測するモデルをXGboostで作成した。それぞれの相分離タイプと非相分離タンパク群との間で、データベースから抽出した各種の特徴量について検定を行い、学習に使用する特徴量を選別した。学習後、特にスコアの高かった相互作用型のタンパク質(DHX9, Ki-67, NIFK)について、vitroで実験(FRAP解析)を行うといずれも凝集性を示した。
特徴抽出の選別から実証実験まで丁寧にされていて良かった。

Deep Learning

深層学習を使ったバイオインフォ系のタスク
タンパク質に結合する薬剤ペプチドの開発において、配列ベースのPPI予測モデルの応用性を比較した。抽出したアミノ酸配列の特徴量+SkipGramの埋め込みをCNNで学習したモデル(PIPR)、事前学習したBiLSTMによる配列表現をCNNで学習したモデル(D-SCRIPT)、データベース中のタンパク/ペプチドにおける部分配列の類似度から結合性を予測するアルゴリズム(SPRINT)を比較した。データベース中のタンパク質の内、ターゲットに対する特異性の高さに注目してモデルを比較するとSPRINTが最も精度が良かった。
工学的に実験が必要な配列を提案する視点でのモデル比較は面白かった。一方で、AF2登場以降は配列ベースの予測に限定する必要がないように思った。
QSタンパクのデータベースから作成したML分類モデル等を元に、ヒト腸内細菌叢で機能し得るQSシステムを提案した。また、これらの結果をQSデータベースとして公開した。
実験でどのくらい確度が補完されるか期待。
タンパク質のアレルゲン性を予測するウェブサーバーツールを開発した。入力アミノ酸配列に対して、BLASTPによるエピトープ探索、ローカルアラインメント、6mer探索を行い、アレルゲン性を判定する。
BLASTPのエピトープ類似度探索を3D構造の比較とするのはどうなのか、よく分からなかった。

Biology in general

ColE1タンパクを用いてE.coliの選別を行うにあたって、ColE1産生細胞の溶出液を精製せずに使える安価なプロトコルを開発した。
lysateとはいえ細胞を混ぜるのは気持ち的に怖いなと感じてしまった。
転写因子上流にTALEの認識領域を配置すると、TALEが転写発現を増幅させる事が分かった。TALEでは認識配列や対象の転写因子に関わらず同様の作用が見られたが、他のDNA結合因子(Gal4, dCas9, zinc finger)では発現量増幅は起こらなかった。TALEの認識配列を逆相補配列にした場合でも増幅作用があった他、リプレッサーの効果も増幅する事が分かった事から、転写因子の結合領域探索を促進している可能性が示唆された。
新たな作用が明らかとなる面白い結果だった。どの様なメカニズムか実証されるのを期待。

合成生物学論文メモ (May 2022)

読み流した論文のメモ。黒色はメモ、緑色は感想、赤色は特に面白いと思ったもの。
30報

Synthetic Biology

Transcription/Translation Control

遺伝子回路、転写翻訳制御など
リガンド(rapamycin)添加による相分離と転写の制御システムを実装した。HOTag3およびHOTag6のホモオリゴマー形成にFKBP/FRBシステムを組み合わせ、リガンド駆動型のクラスター化を実現した。通常のFKBP/FRBによる転写誘導と比較して、リガンドへの感度が高く、一度の誘導で転写促進効果が長く続く事が分かった。
相分離によるタンパク質の隔離効果も組み合わせられると面白そう。
翻訳開始時のリボソームstallingに関わる3-5番目のコドンをGFPの配列でランダム化したデータを用いて、CNNの訓練した。CNNの予測結果をRFPに適用した場合は少し(Pearson core~0.6)相関した。
GFPRFPの違いで0.6程度の相関だと、他のコドン組成の影響もかなり大きそう。
遺伝子の論理回路を、Flapjackプラットフォーム上の実験データに基づいて設計できるpythonパッケージを開発した。
試してみたい。
トリプトファンに結合する転写因子(TrpR, TrpR1)と対応するオペレーター(trpO, trpO1)から成る抑制型バイオセンサー回路を実装した。元々のTrpR1はトリプトファンとその類似化合物(5-hydroxytryptophan)の両方で活性化するが、結合ポケット(I57, V58)に変異を導入する事でそれぞれの基質に対して特異性の高い変異体(V58E, V58K)を得た。また、trpO1への変異(A4C)導入で更に基質への反応性を調整した。
遺伝子の2因子振動回路において、外部からの周期的な刺激によって振動周期を変化させられる事を無細胞系で実験的に示した。振動回路のどちらかの因子を周期的に添加する事で振動周期の増幅または低減を行なった。また、数理シミュレーションと解析によって実験時の状態遷移と分岐の整合性を確認した。

RNA Synthetic Biology

アプタマー、リボザイムなど
  • SHAPE-enabled fragment-based ligand discovery for RNA
  • Authors: Zeller, Meredith J; Favorov, Oleg; Li, Kelin; Nuthanakanti, Ashok; Hussein, Dina; Michaud, Aur{\'e}liane; Lafontaine, Daniel A; Busan, Steven; Serganov, Alexander; Aub{\'e}, Jeffrey; Weeks, Kevin M
  • Journal: Proceedings of the National Academy of Sciences of the United States of America
  • Year: 2022
  • DOI: 10.1073/pnas.2122660119
  • Institution: University of North Carolina, USA
SHAPE-seqのRNA構造嗜好性を利用し、TPP(thiamine pyrophosphate)リボスイッチをデザインした。SHAPEではRNAの一本鎖部分でシグナルが強くなる事を利用して、変異体の構造のスクリーニングを行なった。その後、TPP類似体を用いて候補リボスイッチの特異性と協調的な結合性を調べた。リボスイッチ中の異なる結合ポケットと協調的に結合した二種類のリガンドを接続する事で、結合親和性が10倍以上高いリガンドを作成した。
SHAPEを使ったスクリーニングも、その後のリガンドデザインも面白かった。

Cell-free / Reconstruction

無細胞系、再構成など
無細胞発現系においてnoncanonicalなアミノ酸を発現させる際に、他のペプチジルtRNAによって翻訳されてしまう割合を低下させる手法を開発した。リボソームのS12タンパクに変異(K42T)を導入する事でtRNAのコドン-アンチコドン対合の厳密性を向上させた。N, C末端にそれぞれHis-Tag, FLAG-Tagを付加した際の翻訳効率を計測すると、WTではN末端と比較してC末端の配列の翻訳効率が悪かったが、変異リボソームでは全長の翻訳率が大きく向上した。
細胞内でどの位差が出るのか気になる。
parainfluenzaウイルスにおけるfusion peptideが細胞膜に水透過性の孔のような構造を作ることで細胞内への侵入を開始する様子を、実験とMDシミュレーションによって明らかにした。

Optogenetics

光駆動型ツール、蛍光イメージング、光受容体など、その他〇〇genetics系
  • Signal transduction in light-oxygen-voltage receptors lacking the active-site glutamine
  • Authors: Dietler, Julia; Gelfert, Renate; Kaiser, Jennifer; Borin, Veniamin; Renzl, Christian; Pilsl, Sebastian; Ranzani, Am{\'e}rico Tavares; Garc{\'\i}a de Fuentes, Andr{\'e}s; Gleichmann, Tobias; Diensthuber, Ralph P; Weyand, Michael; Mayer, G{\u}nter; Schapiro, Igor; M{\o}glich, Andreas
  • Journal: Nature communications
  • Year: 2022
  • DOI: 10.1038/s41467-022-30252-4
  • Institution: University of Bayreuth, Germany
青色光受容体であるLOVドメインにおいて、吸光活性部位のGln残基のない変異体を作成し、長らく必須と考えられていたGln残基が吸光反応に必要でない事を示した。初めにBsYtvAのQ123についてスクリーニングを行うと多く(14/19)では青色光に対する反応が保持された。この内、反応性と構造が最もWTに近かったQ->L変異を他のLOVタンパク質(NmPAL, AsLOV2)に導入すると、吸光活性は同様に保持された。
Fig2bが綺麗で面白い。実はちゃんと検証されていない活性グループがLOVドメイン以外にもありそう。
酸化還元反応を受ける転写因子(SoxR)と酸化還元反応を媒介する化合物(pyocyanin, DHNA, methyl viologen)を用いて、電気化学的に制御可能な遺伝子回路を実装した。天然のPsoxRは上下の転写を誘導してしまうため、単方向性のプロモーターをデザインした。
生体に内在性の溶質で出来るともっと面白くなりそう。

Protein Engineering

タンパク質工学
Ca2+センサー(GECO)を用いて、E.coliのナノポアタンパクの機能をスクリーニングする系を開発した。また、S(21)68ホーリンについて、ナノポア形成に必要な最小モチーフ単位を同定し、細胞膜内側のリング構造を異なる由来のものに置き換える工学的手法を可能にした。
スクリーニングから工学までの流れが良かった、面白い。
E. coliの抗生物質耐性タンパク(FabZ, LpxC, MurA)を対象にdeep mutational scanningを行なった。タンパク表面の残基について変異耐性を解析するとMurAが最も変異しづらく、抗生物質耐性も獲得しづらかった。
結果はそれ程振るわなかった感じがあるが、面白い試み。

CRISPR/Cas

クリスパー系
  • Engineered Cas12i2 is a versatile high-efficiency platform for therapeutic genome editing
  • Authors: McGaw, Colin; Garrity, Anthony J; Munoz, Gabrielle Z; Haswell, Jeffrey R; Sengupta, Sejuti; Keston-Smith, Elise; Hunnewell, Pratyusha; Ornstein, Alexa; Bose, Mishti; Wessells, Quinton; Jakimo, Noah; Yan, Paul; Zhang, Huaibin; Alfonse, Lauren E; Ziblat, Roy; Carte, Jason M; Lu, Wei-Cheng; Cerchione, Derek; Hilbert, Brendan; Sothiselvam, Shanmugapriya; Yan, Winston X; Cheng, David R; Scott, David A; DiTommaso, Tia; Chong, Shaorong
  • Journal: Nature communications
  • Year: 2022
  • DOI: 10.1038/s41467-022-30465-7
  • Institution: Arbor Biotechnologies, USA
tracr構造のないgRNAと複合体を形成するCas12i由来のCasシステムを開発した。WTは編集効率が低かったが、typeVのCasにおいてArg又はGly置換を導入する事で編集効率が向上するとの仮説(先行研究)の元でスクリーニングを行い、SpCas9と同等の編集効率を持つ変異体を得た。また、off-target編集はSpCas9よりも少なかった。
gRNAの設計難易度がどれくらい変わるのかが気になった。
Cas9と進化的に共通の祖先を持つinsertion sequence elementであるIscBとωRNA(IscB近傍にコードされたncRNA)との複合体の結晶構造を解析し、TAM(target adjacent motif)認識やR-loop形成、DNA切断における構造的メカニズムを解明した。Cas9とIscBは配列、構造、機能的類似性を示唆する観察結果が得られた。
Cas9がトランスポゾン由来だとは知らなかった。

Metabolic/Signal Pathway Engineering

シグナル経路、代謝経路、代謝酵素工学など
タンパク質工学に置いて一残基変異のスクリーニングでは検出できないepistaticな(単一では性能が下がるが組み合わせると性能が上がるような)変異を探索するスクリーニング手法を酵素で開発し、malnourished-CoA合成酵素を対象にスクリーニングを行なった。スクリーニングでは、基質の類似体を18種類混ぜて使用し、複数の変異株を同一のウェルに混ぜて測定を行った後、最も性能の良かったウェルから基質と変異株の同定を行う。この方法により、いずれかの基質に対して反応効率が高ければ変異を捕捉できるようになり、epistatic変異を検出可能になった。
やりようによっては酵素以外にも適用出来そうな面白いアイデア。配列の潜在空間を数理的に探索する場合との比較も気になる。

DNA / Biophysics

DNA、核酸論理回路、ナノスケール構造物など

Alternative Hosts / Strain Engineering

宿主や系統株の開発
ランダムなgRNAとSpCas9-NG(PAM選択性が緩いもの)を用いて、ゲノムに変異を導入する進化手法を開発した。S.cerevisiaeにおいてβ-carotene合成量を増加させる選択をかけるとchromosomal rearrangementも含む大規模なゲノムの再編成と共に進化を起こした。
進化後のシーケンシングコストが大変そうだが、面白かった。
酵母ゲノムにおいて生存に必要な遺伝子上流に弱いプロモーターを組み込む事でターゲット領域のコピー数増幅を誘導し、目的の挿入遺伝子コピー数、発現量を増加させる手法: HapAmpを開発した。応用例として、内在性の代謝産物(neolidol, limonen, lycopene)生産を増幅させた他、外来遺伝子(AeBlue, HPV16 L1)の発現量も増加させる事ができた。
イデアが面白かった、発展性もありそう。

Miscellany

その他

Computational Biology / Bioinformatics

Representation Learning

核酸アミノ酸配列の表現学習
生化学的な分子の様々な特徴抽出手法(DNA: 43種, RNA: 33種, アミノ酸配列: 65種, タンパク質構造: 14種, リガンド: 17種)を一つのツールにまとめた。
深層学習をかけられない小規模データで特徴抽出するのに助かる。
タンパク質事前学習モデルとグラフ表現を組み合わせて、タンパク質間相互作用を予測するGCNモデルとGAT(graph attention network)を作成した。PDBの構造を元に作成したグラフについて、LSTMベースまたはBERTの事前学習モデル(SeqVec, ProtBERT)から得られた配列分散表現をグラフのノード情報として入力に用いた。多くの評価指標でSeqVec+GATのモデルが最も良い精度を達成した。
ProtBERTより他のモデルの方が良いかもしれないが、配列長の制約?
ProtBERTの埋め込みをタンパク質のグラフのノードとして、PDBからの構造又はAlphafoldによる予測構造をエッジとして転移させ、graph-attentionでタンパク質とペプチドの結合部位予測を行なった。
Alphafoldとの比較を色々しないとで大変そう。

Machine Learning

機械学習を使ったバイオインフォ系のタスク
Cas9のオフターゲット部位予測タスクについて、精度・データサイズ共に良い最新のシーケンスデータを用いて予測モデルを構築した。実験によるとリード数の対数化とネガティブデータ(off-target部位ではない配列)の追加によって予測精度が向上した。
タンパク質およびペプチドの細胞毒性を予測するタスクにおいて、BLASTやモチーフ探索といったバイアスの強い手法とに機械学習手法とを組み合わせて種々のデータセットで高い(AUC~0.99, MCC~0.91)精度を達成した。
マニアックな予測タスク、嫌いじゃない
1600以上のChIP-seq、PBM、SELEXの各データを用いてTF-DNA結合を定量的に予測するモデルを作成した。学習後のモデルを組み合わせて塩基修飾の影響予測、Kd予測、ChIP-setからの直接モチーフ抽出を可能にした。
泥臭いデータ処理を物凄い数やっていて尊敬する。
アミノ酸配列に一残基の変異を入れた場合の自由エネルギー変化を予測するツール(DDGun)のweb版を公開した。DDGunの予測はBLOSUM62からの進化スコア、配列内部の相互作用スコア、疎水性スコア、(あれば)立体構造における相互作用スコアの重み付き和を取る形。
重みの定数は訓練していないと主張しているが、既知データセットとの相関度合いを参考にしたらしい。それはもう訓練してるし、素直にフィッティングした方が良くない?
DNAのハイブリダイゼーション回路における回路解析を行うツールを開発した。これを利用してleak(意図しないstrand displacement)の検出やleakを引き起こす反応経路を同定する事が可能。

Biology in general

クライオ電顕とFRETによる蛍光観察から、8アミノ酸抗生物質ペプチドの一種であるargyrin BがEF-Gとの結合を介した翻訳阻害によって細胞の生育を阻害する事を明らかにした。
ppGpp(guanosine tetraphosphate)がバクテリアの成長速度に関わることは知られていたが、E. coliにおいてppGpp濃度が翻訳伸長速度によって制御されている事を数理モデルにより示した。翻訳伸長中のリボソームのA siteにRelA(GDPをppGppに変換する)結合型tRNAが入り込む事でppGpp濃度が増加する。また、ppGppがリボソームオペロンの転写抑制とリボソームを不活性化する遺伝子の転写促進を行う回路のモデル化も行なった。
E. coliの細胞分裂における主要なタンパクであるFtsAによる分裂開始機構をin vitroで再構成し、拡散速度や活性化状態での生存時間などを定量化した。
E.coliの細胞内RNAの長さをシーケンスで解析したところ、60%以上のRNAが分解中のものだった(リボソーム結合状態のRNAでは少ない)。
分解中のRNAに生物学的な役割があると面白そうなくらいの割合。
同一の蛍光波長で異なる蛍光持続時間を持つ蛍光プローブを用いて、複数の細胞内ターゲットを同時に観察する手法(fluorescence lifetime multiplexing)を18種類の化学的蛍光プローブへ拡張した。初めに各プローブの蛍光持続時間を計測し、応用例として8種類の異なる細胞部位を同時に観察する事に成功した。
パラメータ次第では蛍光タンパクにも応用できるかも。持続時間をターゲットにした蛍光タンパクデザインも出来るかもしれない。

合成生物学論文メモ (Apr 2022)

読み流した論文のメモ。黒色はメモ、緑色は感想、赤色は特に面白いと思ったもの。
32報

Synthetic Biology

Transcription/Translation Control

遺伝子回路、転写翻訳制御など
複数の炭素源(糖)が存在する環境におけるE.coliの嗜好性が、細胞の成長に起因する糖分子の拡散によって説明できるとの主張。数理モデルとlacオペロンを用いた実験による裏付けを行った。また、このモデルからE.coliは環境での最適な炭素源の選択を行っている事が説明できる。
拡散と成長速度の両方を考慮した遺伝子回路設計が出来ると面白そう。
Toehold switchを利用して、トリガーのRNAを入力信号とするパーセプトロン回路を実装した。二次構造を形成するswitchをニューロンのweight、トリガーRNAを入力と考えて3種類の入力に対するweighted sumの結果をGFP出力として構成した。また、anti-σ28を定常発現させ出力をσ28ファクターに置き換える事で閾値による出力の二値化を行った。
言葉遊びな部分はあるが、back propagation等の実装にも繋がりそうな気がするので面白そう。
Toehold switchとanti-sense trigger RNAを用いて2-input 2-outputの論理回路を実装した。また、各RNA要素とプロモーターとの距離によってkmやスイッチON時の発現量の最大値が変化した。
拡散や分解をうまく調整すれば振動やパターン形成も目指せそう。
luxオペロンのluxR-luxI間に存在するCRP(cAMPと複合体を形成しDNAに結合するタンパク)結合領域が、luxR側のプロモーター誘導機能を持つことを示した。10種類の異なるluxボックス配列に対してCRP結合領域を4つまでタンデム化し、幅広いレンジでの転写発現制御を実装した。
TF結合領域のタンデムの様な形で面白かった。

RNA Synthetic Biology

アプタマー、リボザイムなど
SpinachアプタマーとFBP(fructose 1,6-bisphosphate)結合性アプタマーをテンプレートとしてSELEXを回し、FBPバイオセンサーを作成した。元のアプタマーからステムループとG4構造のデザインを部分的に決めた後、残りをランダム化してSELEXをかけた。得られたFBPバイオセンサーの応用として、ヒト細胞の解糖系の反応を蛍光計測した。
SELEXをうまく回すためのデザインの決め方が難しそう。
toehold switchにステムループを追加し、triggerRNA存在下でもステムが形成される様なデザインを行った。これにより翻訳ONswitchにおける構造の安定化と、翻訳OFFswitchのデザインを可能にした。
シンプルながら汎用性の高いデザインで面白い。通常のtoehold switchとのデザイン面での比較が気になるところ。
特定のRNA二次構造に結合するタンパク質(MCP, PCP)による翻訳制御機構に対して、対象の二次構造をとる様なRNA構造体を競合阻害剤として機能させる系を実装した。翻訳対象のアプタマーと競合阻害するRNAの濃度で翻訳量を調節可能。
翻訳量のモデリングも出来そう。
EternaのプレイヤーによってデザインされたRNA配列から、MCPがMS2構造に結合した時のみ作用するFMNアプタマーを実装した。Eternaからの提案と実測とを7ラウンド回した結果、30のデザインが熱力学に最良に近いON/OFF比を達成した。
ゲームデザインから長期で上手くやっていて強い。

Cell-free / Reconstruction

無細胞系、再構成など
CRISPR/Cas12aとRT-RPAを用いたCOVID-19検出系について、BICを用いた回帰因子選択によって反応系のパラメータ(バッファー濃度や反応液量など)最適化を行った。

Optogenetics

光駆動型ツール、蛍光イメージング、光受容体など、その他〇〇genetics系
K+蛍光センサーの結合親和性を向上させ、哺乳類細胞におけるK+濃度に適したセンサーの作成に成功した。初めにゲノムマイニングによって同定したE.coli由来のK+結合ドメインをmNeonGreen1に埋め込み、結合親和性の高い(Kd ~ 69 mM)センサーを作成した。その後、構造解析(NMR)とホモログとの比較(BLAST)から見出した結合活性領域に変異を導入し、二種類の変異体(Kd~138mM, Kd~96mM)を得た。これにより哺乳類細胞におけるK+の休止電位(140-150mM)に近いKdを達成し、HeLa細胞での実証を行った。
目的とデザインの流れが綺麗だった。活性部位を同定した時点でdirected evolutionをかけた場合との比較が気になった。
  • Ultrasound-controllable engineered bacteria for cancer immunotherapy
  • Authors: Abedi, Mohamad H; Yao, Michael S; Mittelstein, David R; Bar-Zion, Avinoam; Swift, Margaret B; Lee-Gosselin, Audrey; Barturen-Larrea, Pierina; Buss, Marjorie T; Shapiro, Mikhail G
  • Journal: Nature Communications
  • Year: 2022
  • DOI: 10.1038/s41467-022-29065-2
  • Institution: California Institute of Technology, USA
超音波振動によって生体マウスにおける組織特異的な遺伝子発現誘導を行い、がん腫瘍の成長抑制を非侵襲に行うことを可能にした。はじめに温度(42℃)依存性のリプレッサー(Tcl42)を用いて、遺伝子発現回路を作成した。その後、回路を導入したE.coliをマウスに注射し、in vivoで超音波を用いた遺伝子発現を実装した。
probioticsの新たな形で面白い。
  • A highly photostable and bright green fluorescent protein
  • Authors: Hirano, Masahiko; Ando, Ryoko; Shimozono, Satoshi; Sugiyama, Mayu; Takeda, Noriyo; Kurokawa, Hiroshi; Deguchi, Ryusaku; Endo, Kazuki; Haga, Kei; Takai-Todaka, Reiko; Inaura, Shunsuke; Matsumura, Yuta; Hama, Hiroshi; Okada, Yasushi; Fujiwara, Takahiro; Morimoto, Takuya; Katayama, Kazuhiko; Miyawaki, Atsushi
  • Journal: Nature Biotechnology
  • Year: 2022
  • DOI: 10.1038/s41587-022-01278-2
  • Institution: RIKEN, Japan
従来の蛍光タンパク質と比較してphotostabilityが高く、明度も高い緑色蛍光タンパクStayGoldを開発した。一般にphotostability が高い蛍光タンパクを明るくするには発色団熟成でのO2利用を促す変異を加える必要があり、これが発色団の一重項or三重項励起状態への遷移を促進してしまう。StayGold作成にあたってはテンプレートのCU17Sに対して1残基のみの変異(V168A)で十分な明るさを達成できたため、明るさとphotostabilityの両方を満たす蛍光タンパクとなった。
なぜ1残基の、しかもV->Aという微妙な変異で明るくなったのか気になった。
  • Synthetic cells with self-activating optogenetic proteins communicate with natural cells
  • Authors: Adir, Omer; Albalak, Mia R; Abel, Ravit; Weiss, Lucien E; Chen, Gal; Gruber, Amit; Staufer, Oskar; Kurman, Yaniv; Kaminer, Ido; Shklover, Jeny; Shainsky-Roitman, Janna; Platzman, Ilia; Gepstein, Lior; Shechtman, Yoav; Horwitz, Benjamin A; Schroeder, Avi
  • Journal: Nature Communications
  • Year: 2022
  • DOI: 10.1038/s41467-022-29871-8
  • Institution: Technion, Israel
油脂膜の中に青色発光タンパク(Gaussia luciferase)の発現系を封入し、これをを光要求性の胞子形成を行うカビと共培養する事で、胞子形成を誘導した。その他にも、油脂膜にEL222を追加したフィードフォワード回路や、油脂膜外側にGlucを発現させ、iLIDのリクルートを行うシステムを実装した。
面白いけどストーリーがやや強引では。

Protein Engineering

タンパク質工学
天然のタンパク質が結合する金属イオンはイオン化傾向の高いCu2+やZn3+である事が多いが、Ni2+やCo2+とより強く結合するようなタンパク質を人工的に作成した。シトクロムに対してCysと3つのHisからなる金属イオン結合モチーフを複数導入し、異なる結合活性を持ったシトクロムを得た。結合モチーフを複数導入した事で、一分子のCu2+やZn3+への特異性を二分子のNi2+やCo2+が持つ協調的な結合が熱平衡的に上回るような結果となった。
プロトンポンプの機能を持つロドプシンチャネルに変異を加えてCl-センサーに変化させる方法について、進化的な情報を加味して理論的に変異選択する方法の開発。データベース上のロドプシンファミリーの配列群にDCA(direct coupling analysis)をかけ、進化的関連の強い残基ペアの検出と配列のファミリーらしさ(Hamiltonian score)を計算した。ロドプシンチャネルに機能変化を加えるためにはファミリーから逸脱する必要があるとの仮定から、進化的関連性の高い残基に対して最もHamiltonian scoreの変化が大きくなるような変異を施し、実験で効果(Cl-センサーとしての性能向上)を実証した。
理論的な変異導入手法で、MSA-Transformer等使ったらより広く使えそう。

CRISPR/Cas

クリスパー系
SpCas9のgRNAについて、tracrRNAとcrRNAのハイブリダイゼーション時に出来るバルジ領域の下流側がgRNAとしての特異性に寄与する事を明らかにした。これを元に内在性のmRNAを標的にしたtracrRNAのデザインを可能にし、SARS-COV-2のmRNAを検出する系を作成した。
gRNAのデザインの幅が広がって面白い。CRISPR/Cas周りだけ使った複雑な回路が出来そう。
ABA(abscissic acid)またはUVによって誘導可能なRNAのm6A修飾システムを実装した。システムはdCas13b-PYLとABI-METTL3から成り、ABA添加によってPYL/ABIのヘテロ二量体が形成されると部位特異的に結合したdCas13bへリクルートされたMETTL3がm6A修飾を行う。結果として、単独のdCas13b-METTL3よりは劣るが実用に十分な編集効率を得た。UVのシステムではDMNB(4,5-dimethoxy-2-nitrobenzyl)-caged ABAが用いられ、UV照射によってDMNBケージが解除される仕組み。既存のdCas編集システムを誘導可能にした形。UVの照射が2分間なので、CRY2等でヘテロダイマー部分を置き換えても使いやすそう。
SpyCas9のgRNA内に、RNAのミスマッチ結合を誘導するMBL(mismatch binding ligand)の結合モチーフを導入し、MBL添加によってCas9活性を制御する機構を実装した。in vitro、HeLa細胞それぞれで実装したほか、Cas9とgRNAをプラスミドで細胞へ導入した場合にも有効であることを示した。
MBLというのを初めて知った。応用の展開まで丁寧に検証されていて良かった。

Metabolic/Signal Pathway Engineering

シグナル経路、代謝経路、代謝酵素工学など
除草剤に使用されるGlyphosateは化学的な製法では有害物質が排出されるため、生物学的な産生方法の開発が求められている。glyphosateの前駆体となるAMP(aminomethylphosphanate)を酵母で生産するため、必要な酵素遺伝子クラスター(AlpGHIJKL)の同定、酵母への導入、RBSとプロモーターの最適化による律速反応の効率化を行った。
反応経路のどの部分をどの酵素が担っているかを解析する部分に対して配列/構造解析から解釈を与えられそう。

DNA / Biophysics

DNA、核酸論理回路、ナノスケール構造物など
銀ナノ粒子(AgNP)を架橋するペプチドの組成と濃度を変化させる事で、AgNPが自己組織化して形成するフラクタル構造の大きさ(20nm-2μm)が変化する事を示した。また、この仕組みを応用してSARS-CoV-2の主要プロテアーゼの活性を検出する系を構築した。

Alternative Hosts / Strain Engineering

宿主や系統株の開発
PAM配列がNGの二塩基のみであるxCas9をPseudomonasに実装し、幅広いターゲット配列におけるA:T→G:C編集を可能にした。gRNAデザインツール(CRISPOR)とアミノ酸置換によるタンパク質活性変化予測ツール(SIFT)を組み合わせた応用例としてP. putidaにおける酵素のノックダウンによりmuconic acid産生を増加させた。また、非モデル系統株(P. chengduensis)に導入しPseudomonas一般に使用出来る可能性を示した。

CHO(Chinese Hamster ovarian)細胞において、定常発現/トランスフェクション時のプロモーターによる発現効率を比較した。デュアルレポーターシステムのFluc/Rluc比によるとウイルス由来のCMV-mlEが最も高発現。
CMVプロモーターってすごいんだなあ。
シアノバクテリア(Synechocystis sp. PCC6803)とE.coliの両方で機能する10種類のプラスミドを作成した。pSC101をバックボーンとして、Synechocystis内在性プラスミドのORFを導入した。
ORF以外の部分もまとめて導入しているようなので、その辺りの最適化を他の例だとどの様にしているのか気になった。

Miscellany

その他
IgGの糖鎖修飾を行う反応系を確立し、30以上の修飾酵素による糖鎖修飾を施した。カラムに固定したIgGに対して候補となる修飾酵素と最適化されたバッファー溶液を修飾する順番に入れる事で反応を段階的に行う事が可能。応用例として、IgGへの糖鎖修飾導入により熱安定性や結合親和性を変化させた。
  • Development of NanoLuc-targeting protein degraders and a universal reporter system to benchmark tag-targeted degradation platforms
  • Authors: Grohmann, Christoph; Magtoto, Charlene M; Walker, Joel R; Chua, Ngee Kiat; Gabrielyan, Anna; Hall, Mary; Cobbold, Simon A; Mieruszynski, Stephen; Brzozowski, Martin; Simpson, Daniel S; Dong, Hao; Dorizzi, Bridget; Jacobsen, Annette V; Morrish, Emma; Silke, Natasha; Murphy, James M; Heath, Joan K; Testa, Andrea; Maniaci, Chiara; Ciulli, Alessio; Lessene, Guillaume; Silke, John; Feltham, Rebecca
  • Journal: Nature Communications
  • Year: 2022
  • DOI: 10.1038/s41467-022-29670-1
  • Institution: The Walter and Eliza Hall Institute for Medical Research, Australia
Nanolucをターゲットにしたタンパク質分解誘導基質を作成し、既存のタンパク質分解システム(FKBP12が目標のdTAG, HaloTag7が目標のHaloPROTAC)との実験的な比較を行った。単純な分解速度と分解誘導でリクルートできるプロテアーゼの種類はdTAGが良かった。
Nanolucをルシフェラーゼとしても分解タグとしても使える様になるので便利そう。基質のコストが気になるところ。

Computational Biology / Bioinformatics

Representation Learning

核酸アミノ酸配列の表現学習
タンパク質の事前学習済みモデル(UniRep, SeqVec, ESM-1b, ESM-MSA, ProtBERT, ProtT5)から得られる表現ベクトルがタンパク質構造予測とファミリー分類タスクにどの程度応用できるかを比較評価した。各モデルからの表現を使ってMLP, ResCNN+BGRU, LightAttentionの何れかを学習した。また、ESM-1b, ESM-MSA, ProtT5を使ってアンサンブル学習すると殆どの評価でベストスコアを出した。
タンパク質の事前学習済みモデル(UniRep, SeqVec, ESM-1b, ESM-MSA, ProtBERT, ProtT5)から得られる表現ベクトルがタンパク質構造予測とファミリー分類タスクにどの程度応用できるかを比較評価した。各モデルからの表現を使ってMLP, ResCNN+BGRU, LightAttentionの何れかを学習した。また、ESM-1b, ESM-MSA, ProtT5を使ってアンサンブル学習すると殆どの評価でベストスコアを出した。 単独で使う場合はProtBERT以外のBERTはそれほど変わらなさそう。下流のNN構造も軽く試す分にはMLPで十分っぽい。
SMILESを入力に取る化合物の事前学習済みBERT(K-BERT)を新たに提案した。事前学習では入力化合物の原子の特徴(角度、芳香属性、水素原子、キラリティ)予測、化合物の特徴(MACCS fingerprints)予測、同一化合物の異なるSMILES表現を近付ける対照学習、3つを行った。応用例として薬剤化合物予測や化合物の特徴予測を行った。
Ablation studyもしてあって、事前学習法として面白かった。

Deep Learning

深層学習を使ったバイオインフォ系のタスク
異なる生物種にわたって減数分裂時の組み換えホットスポットを予測し、予測に重要なの生物学的特徴(PRDM9結合モチーフ ヒストン修飾 GC含有率)を抽出出来る深層学習モデルを開発した。深層学習の構造はCNN, GRU, attentionからなる。訓練後のモデルで計算した塩基ごとの重要度を連続的な信号(分布)に変換し、ローパスフィルタをかけてモチーフを抽出する。既存のモデルと異なり、ローパスフィルタの係数によって可変長のモチーフ抽出が可能。
NGSで使用するプライマーのデザインを焼きなまし法によって自動化&高効率化し、プライマー同士のハイブリダイゼーション形成を大幅に削減した。

Biology in general

E.coliの電子伝達系についてシステム生物学的な解析を行った。E.coliで四種類のプロトンポンプ欠損株を作成し、増殖速度が一定になるまで研究室内進化を行った後、全ゲノム解析、プロテオーム解析から進化に寄与した遺伝子や代謝経路を同定した。結果として全ての株は近い増殖速度(~0.87/hour)に至り、代謝経路の流量を最適化する形でH+/ATP比が10/3に保たれた。
テーマもアプローチも面白かった。構成的に再現できたら更に面白そう。
天然の配列において非AUG開始コドンの嗜好性の順位はCUG>GUG>UUGである事が知られていたが、Uをψに置き換えることでGUG, UUGの嗜好性が向上し、Cに5mC修飾を施すことでCUGの嗜好性が低下した。また、MDシミュレーションによって修飾前後の開始コドンとアンチコドンとの塩基対形成の動態を解析し、実験結果を裏付けた。
KaiCタンパクのS431とT432それぞれのリン酸化/脱リン酸化状態における四種類の結晶構造を解いた。天然のKaiCは四種類の状態を振動するが、得られた構造を元に作成したT432V変異体はS431のリン酸化/脱リン酸化のみで振動することを示した。これらの事から、431番残基はリズム性能に対して、432残基はリズムの概日性に対しての自然選択の結果である事が示唆された。
面白かった。

合成生物学論文メモ (Jun 2021)

読み流した論文のメモ。黒色はメモ、緑色は感想、赤色は特に面白いと思ったもの。
15報

Synthetic Biology

Transcription/Translation Control

遺伝子回路、転写翻訳制御など
QSベースのトグルスイッチを用いた代謝物産生と細胞生育との切り替え回路に、ネガティブフィードバックを組み込む事によって誘導因子への応答速度を向上させた。
モデルで予測すると面白そう。

RNA Synthetic Biology

アプタマー、リボザイムなど
TrpアプタマーにRBSを組み込んだリボスイッチを用いて、Trp合成量を増加させるようなRNAの変異のハイスループットスクリーニング行う事を可能にした。スクリーニングにはマイクロ流路における液滴の選別を利用した。

Cell-free / Reconstruction

無細胞系、再構成など

Optogenetics

光駆動型ツール、蛍光イメージング、光受容体など、その他〇〇genetics系
緑色光に応答して二量体化を解くタンパク質ドメイン(TtCBD)を哺乳類細胞膜内側に繋ぎ、TF(TetR, VPR)を用いて光に応答した転写誘導システムを構築した。また、膜のTtCBD同士の暗条件での二量体化を防ぐために帯電GFPを繋げてON/OFF精度を向上させた。応用例として、Apple Watchの緑色LEDを使った生体マウスでの発現誘導が可能である事を示した。
マウスがApple Watch背負っててなんかシュール。
AAVウィルスベクターを利用した近赤外光誘導性の時空間的に制御可能な哺乳類細胞の形質転換システムを実装した。腫瘍細胞で広く発現するEGFRに対して結合性を示すDARPinとPhyBを繋げたタンパク質で前処理を行い、PIF6を表面に発現させたAAVベクターを添加した際に、近赤外光でPhyB-PIF6二量体化を誘導する。
一細胞単位の精度でトランスフェクション出来るらしいので、細胞集団の制御が色々捗りそう。
960nmの近赤外光照射に応答して腫瘍細胞のネクロシスをE.coliが誘導する系を作成し、生体マウス組織中での腫瘍の成長を抑制する効果を実証した。960nmの光を青色光に変換するupconversion nanoparticle(UNC)と、青色光応答性転写制御(EL222)によってTNFαを発現するE.coliとをそれぞれ腫瘍に注入し、近赤外光照射による発現誘導を行った。
upcomversionを知らなかった。目的の組織等に特異的に結合させるのが難しそう。

Protein Engineering

タンパク質工学
15残基からなる機能性ペプチド(Y15)付加によるタンパク質の凝集システムを作成し、応用例としてY15-Nck凝集によるN-WASP活性化とそれに伴うアクチン重合を起こせる事を示した。Y15は片側にTyrがもう片側にGluとLysが向くようなβストランドを形成し、Tyr同士の疎水性相互作用とπスタッキングによって凝集する。
ディスカッションにも書かれているが、凝集性IDRとの関わりを分析したりヘテロ二量体化に転換させたり、色々拡がりそう。
  • Engineering the protein dynamics of an ancestral luciferase
  • Authors: Schenkmayerova, Andrea; Pinto, Gaspar P; Toul, Martin; Marek, Martin; Hernychova, Lenka; Planas-Iglesias, Joan; Liskova, Veronika Daniel; Pluskal, Daniel; Vasina, Michal; Emond, Stephane; Dörr, Mark; Chaloupkova, Radka; Bednar, David; Prokop, Zbynek; Hollfelder, Florian; Bornscheuer, Uwe T; Damborsky, Jiri
  • Journal: Nature Communications
  • Year: 2021
  • DOI: 10.1038/s41467-021-23450-z
  • Institution: St. Anne’s University Hospital Brno, Czech Republic
ルシフェラーゼ(Rluc)の祖先に当たる安定かつ変異可能なタンパク質(AncHLD-Rluc)に変異を加えていく事で機能改変に関する進化的動態を解析した。はじめに点変異を加えていく事で、機能的に重要な残基を同定し、統計的因子解析によってタンパク質の折り畳み温度が重要な因子である事を示した。更なる機能の改善には、既知のタンパク質(Rluc8)の機能部位を移植する事が有効である事を示した。
点変異->ドメイン置換のタンパク質進化の流れを追っているようで面白い。
キナーゼ活性だけを持った変異型チロシンキナーゼドメインとリン酸化シグナル伝達ドメインとを組み合わせ、特定のシグナル伝達だけを活性化する受容体を作成した。二量体を形成する受容体チロシンキナーゼ(c-KItT)に複数のTyr->Phe変異を加え、シグナル伝達誘導を失活させた。これをリン酸化シグナル伝達ドメイン(STAT1, 3, 5)と組み合わせて受容体を形成した。二量体形成の誘導には変異型FKBPやLOVドメインを用いる事が出来た。
変異導入箇所をどう選んだのか(構造等からの確証がどれくらいあったのか)気になる。

CRISPR/Cas

クリスパー系
ショウジョウバエの遺伝子ドライブにおける制限装置として、特定の遺伝子を持った雌雄の間で致死性遺伝子発現及びその回避が起こるような仕組みを実装した。dCas9-VPRによって誘導される致死性遺伝子発現と、そのdCas9結合部位に変異を加えるCas9+sgRNAとをそれぞれ雌雄のハエに分けて発現させた。

Metabolic/Signal Pathway Engineering

シグナル経路、代謝経路、酵素工学など
E.coliを用いた代謝産物合成系での誘導物質の使用量を減らすため、細胞生育と代謝物産生の間の相転移を不可逆にした遺伝子回路を実装した。
面白いアイデア。細胞が死んでいく中で長期的な代謝産物産生量の制御がどのように出来るか気になる。

DNA / Biophysics

DNA、核酸論理回路、ナノスケール構造物など
タイル状にアニーリングしたDNAの自己組織化により形成されるDNAナノチューブを、ナノチューブ形成の各段階で油膜の内側に封入する事に成功した。油膜への封入にはマイクロ流路による油膜生成を利用した。DNAタイルと自己組織化を誘導するトリガーRNA発現系とを同時に封入した油滴においては、時間と共にDNAナノチューブが形成される様子が見られた。
RNA発現を誘導因子で制御出来たりすると微小管をDNAで置き換えるような事にもなりそう。
  • Programmable icosahedral shell system for virus trapping
  • Authors: Sigl, Christian; Willner, Elena M; Engelen, Wouter; Kretzmann, Jessica A; Sachenbacher, Ken; Liedl, Anna; Kolbe, Fenna; Wilsch, Florian; Ali Aghvami, S; Protzer, Ulrike; Hagan, Michael F; Fraden, Seth; Dietz, Hendrik
  • Journal: Nature Materials
  • Year: 2021
  • DOI: 10.1038/s41563-021-01020-4
  • Institution: Technical University of Munich, Germany
DNA折り紙の自己組織化によって、DNA構造体の内側にウイルスを捕捉するシステムを実装した。DNA構造体の内側にウイルスへの抗体を付着させ、vitroでのHBVの捕捉、培地中のアデノウイルスを補足する事によるHEK293細胞への感染防御を実証した。
感染自体を物理的に止められる可能性。

Computational Biology / Bioinformatics

Representation Learning

核酸アミノ酸配列の表現学習
抗生物質としてはたらく機能性ペプチドを予測するモデルをBERTの事前学習とfine-tuningによって作成した。
k個ごとに区切るk-merの作り方だと単純に情報の粒度が1/kになって、予測精度が下がるのは当たり前な気がする。
MHCとペプチドの間の相互作用を予測するタスクで、大規模なアミノ酸配列で事前学習済みのTAPE Transformerをfine-tuningして精度を向上させた。入力にはMHCとペプチドの配列を繋げたものを与え、出力層ではMLPの手前で表現ベクトルの深さ方向に平均を取るプーリングを加えた。
CLSトークンを使う場合との違いはどれくらいあるのかも気になる。

General Biology

マイクロ流路において培地の栄養状態を細かく(数分~数十分 マイクロ流路において培地の栄養状態を細かく(数分~数十分)変化させた場合に起こるE.coliの生育速度の変化を解析した。最短で5分周期の培地の変化に対しても生育速度の変化が生じる事が分かった他、培地の栄養量と生育速度とは非線形な関係を示した。また、低栄養状態から高栄養状態への変化においては応答(生育速度の変化)が比較的ゆっくりなのに対し、逆の変化では急峻な応答を示した。