P049P16 Strictosidine Synthase Gene Proximal to SP6 End

Supplementary Table 1.

List of genomic sequences, predicted coding sequences and predicted protein sequences for genes carried on BAC clones P049P16, P166A09 and P023C09 anchored to the I-3 region of tomato chromosome 7.

P049P16 strictosidine synthase gene 1 proximal to SP6 end of BAC and corresponding to marker bP16. Similar to At1g08470, At2g41290, At2g41300, At3g57010, At3g57020 and At3g57030. Gene lacks introns.

ATGAATGATTCAAATATACTATTGTTGTTCATTGCTACTGTAGCGTTATTTTCCTCAGTTAATTTAGCCTTTGATGATTC

GGAAAATGCGTTGAAATCCCAAAATGTACTCTCAAAATCCGAAATCATCCAACTTAATGGAGCAATTGGACCAGAGAGTG

TTGCTTTCGATCCAAATGGTGAAGGCCCATACATAGGCGTAGCCGATGGACGAATACTCAAGTTTCAAGGATCACATTGG

GCTGATTTTGCAGTCACTTCTTCTCAAAGGGAGAGTTGTACACTGCCTTTTGCACCAGAAATGGAGCATATATGTGGGAG

GCCATTAGGTTTACGATTCGATACAAAAACAGGGGAACTCTACATTGCTGATGCGTATTTCGGGCTCCAAGTTGTTGGAC

CAAAAGGAGGATTAGCTACACCGTTAATCCAAATATTAGAAGGTGAGCCTTCTTATCTTCCAAACGACGTTGATATTGAT

GATCAAGACGATGTGATTTACTTCACCGACACAAGCACAAGGTACCAACGCAGACAATTTGTCGACTCTCTTTTAAGCAG

AGACGCGACTGGCAGGCTAATGAAATATACTAAATCAACCAAAACAACTGAAATACTAATAAGAGGCCTTGCTTTTGCGA

ACGGTGTATCTTTGAGCAAAGACCGATCATTCGTACTAGTAGCTGAAACTTCTAATTTTAGAATTTTGAGGTACTGGCTT

AAAGGCCCTCTTGAGGGAACACATGATACATTTGCTGAGTTGCCAGGGTTTCCGGACAACATTAGAATGAACTCGAAAGG

GGAATTTTGGGTAGCTATACAAGCAATAAGATCACAATCGAGTTTTTCAAATTCGGAAATGGGAAATGAATTGTTGAAGC

TCCGATTCATCGCGCAAAAATTTAACAATTTGTTACGTGGAGGGCTGCTGCACGCTACAGCAATCAAGCTAAGCGAGGAC

GGGCGAGTTTTGGAGGTTCTAGAAGATGTTGAAGGCAAGACGTTGAGGTCTATAAGTGAAGTTCATGAGATATATGACAA

GTTGATGTTTGGTTCTGTTATAATGCCTTTTTTGGGAGTTTATGAATTA

Predicted protein - 363 amino acids

MNDSNILLLFIATVALFSSVNLAFDDSENALKSQNVLSKSEIIQLNGAIGPESVAFDPNGEGPYIGVADGRILKFQGSHW

ADFAVTSSQRESCTLPFAPEMEHICGRPLGLRFDTKTGELYIADAYFGLQVVGPKGGLATPLIQILEGEPSYLPNDVDID

DQDDVIYFTDTSTRYQRRQFVDSLLSRDATGRLMKYTKSTKTTEILIRGLAFANGVSLSKDRSFVLVAETSNFRILRYWL

KGPLEGTHDTFAELPGFPDNIRMNSKGEFWVAIQAIRSQSSFSNSEMGNELLKLRFIAQKFNNLLRGGLLHATAIKLSED

GRVLEVLEDVEGKTLRSISEVHEIYDKLMFGSVIMPFLGVYEL

P049P16 strictosidine synthase gene 2 distal to SP6 end of BAC relative to gene 1 and corresponding to SGN-U323940. Similar to At1g08470, At2g41290, At2g41300, At3g57010, At3g57020 and At3g57030. Gene lacks introns.

ATGAATGCTTCAAATATACTATTGTTGATTATCGTTGTACAACTTGTTTCAGTAAATTTAGCCTTTGAGAAAACTCAAAA

CGTTCTCTCAAAATCGAAAATTATCCATCTTAATGGGTCGATTGGACCGGAGAGTGTTGCGTTCGATCCAAATGGCGAAG

GTCCATACATAGGAGTAGCCGATGGACGCATTCTCAAGTTGCAATTAGGGTCAAATAATCGATTATTTTGGGCTGAATTC

GCGGTCACTTCTTCTCATCGAAGGGATTGTACCTCACCATTCGCTCCTAAAATGGAACATATATGTGGTAGGCCATTAGG

CTTACGATTCGATACAAAAACAGGTGAATTATACATTGCAGACGCGTATTTAGGTCTACAAGTTGTTGGACCCAAAGGTG

GACTAGCAACTCCATTAGTTCAAAAATTCGAAGGTAAACCTCTTGTTTTCACAAATGACGTTGACATTGACGATGATGTG

ATTTATTTCACGGATACAAGCACCAAGTATCAACGCTGGCAGTTTCTAACGTCGTTTTCAAGTGGTGATACGACTGGTAG

GTTGATGAAATATGATAAATCTACGAAAAAAGTAACAGTCTTATTAGGTGATCTTGCTTTTGCAAATGGCGTTGCGTTGA

GTAAAAACAAATCGTTTGTTTTAGTGACTGAAACTACAAATTTTAGAATTTTAAGGTATTGGCTTAAAGGCCCCTTAGTA

GGAACACATGATGTATTTGTTGAGTTGCCCGGGTTCCCGGACAACATCAGAATAAACCCTAAAGGGGACTTTTGGGTCGC

GTTACAAGCAATAAGATCAGTACCCAGTGTTTCAGATTCGAAATTTGGAATGTTTAGTTTCAACCCTCAGCAAATGGGAG

ATGACGGGGAGCTACACCCTACCGCCCTCAAGCTAAGTGAGGACGGGCAAGTTTTGGAAGTTCTAGAAGATGTTGAAGGC

AAGACATTAAGGTCTATAAGTGAAATTGAAGAAAAAGATGGGAAGTTATGGATTGGTTCTGTTGTGATGCCTTTTTTGCG

AGTTTATGAAATG

Predicted - 351 amino acids

MNASNILLLIIVVQLVSVNLAFEKTQNVLSKSKIIHLNGSIGPESVAFDPNGEGPYIGVADGRILKLQLGSNNRLFWAEF

AVTSSHRRDCTSPFAPKMEHICGRPLGLRFDTKTGELYIADAYLGLQVVGPKGGLATPLVQKFEGKPLVFTNDVDIDDDV

IYFTDTSTKYQRWQFLTSFSSGDTTGRLMKYDKSTKKVTVLLGDLAFANGVALSKNKSFVLVTETTNFRILRYWLKGPLV

GTHDVFVELPGFPDNIRINPKGDFWVALQAIRSVPSVSDSKFGMFSFNPQQMGDDGELHPTALKLSEDGQVLEVLEDVEG

KTLRSISEIEEKDGKLWIGSVVMPFLRVYEM

P049P16 gene similar to At2g30900. Four introns predicted downstream of the start codon/upstream of the stop codon. Protein coding sequence shown in bold type.

ATGAAAAATTCTCTAATAATTTTTCATAATTGCTTCTTCAAATTACTAGTAATTATAATCAACATTATTTTGTTCATCAA

TAATAATGTTGATTTTCTAGTAGAAGCAAAACAAAACAAGCTACTACATCCTCCCTTCAAAAAAAAGGGTGCAAATTGTG

ATTTATATGATGGAAAATGGGTTATTGATTATAATTATCCACTTTATAATGCAAAAAATTGTCCATTTTTACTTCAACAA

TTTGATTGTGTAAAGAATGGTAGACCAGATAAAGCATATCTCAAGTATAGATGGCAACCCACAGATTGTAACTTAGCCAG

GTAATGAATTACATCTATCTATCTTTTTTATCGTGTTTTTCTTGCTGTCTTTCGAAAACGTCTATTTACCTCTATGAAGT

AATGGTTAAATCTATATATGTTTTATCTTTTTTGTATGGTACTTAATGAAATAATACTGAATATGTTAGTATTATTCGTA

TAAATAATAGATAAAAAAATAAATAGATAGAGAAATTTTGAACGAATTGTTTCATCTTGTATGTATCGAAAGTTGATTGA

TGACAAGTGGCTGATAAAAGTTACTTATATTTAAAAAGCCAATGCTTATGGTGAGGGTCGAGGCGGAGAAATTAGAAATT

TCGTTAAAGAAAGTTTTAAGAATTAATATATACATAATTTTATATATATATATATATATATATATATATATATATATATA

TAATATATTTTTTTAACGAAAGATGATTAACTAACATTCTTTCGTTGTATATGGCTGAGTCACTAAACGAAGACCATATT

TTATTGTGACATTTGAAAAATATGATTTTTACTTTAAAAATCGAAAATGATACTGAAAATGAAAGTTATGCATAATTACG

GATACAAATTAGAGTTGTTTTTTTAAATTTTTTTTATGAGAGAAAAAAGTGAAAAATACTTTTTGTTATTTTCTAAAACT

CTATTTTTTACATTCTAGTTGAATTCCATATGCTTATTGTCAAATGTGCTTTCCCAAGTTCAACTTTAGAGAAGAAAAAA

ATTGAAACAATTTCATAGACAAACAAATATTCGATTTCTCACTTTATAATATTCTTTTCGTTTAAAAAAAAAAATATTCT

CCCCAATTCTTTAATCTCCTATCTAATATTTTTTTAAATAAATATAAAACAGATGAAAAAACTTGTCTCATCTATATCGT

GCTTCGTAAATATTCGATTATCTAGGTGAACATGTTTTGCTTGATAATTGAATTATTTGTTTTCGCGCATTCTGTTTTTT

GCCATTTACGTTGTTGAGTCCTCTCTACAAACCAAAATGTTACTTTCTACTTATCGTCTCAACTTATATCATAATTCAAA

ATTTATCGTGACTTATAATATTTTTATGTAATTTTAAATATATAAATTATTTTTTAATTTCTTAAAAATTATATGACCAA

ATGAATGGTCAAAATGAAAATTAGTAATTTAAATGATATCATACAAATTGAAATGAAAAAAATAATTAAGATTTCTTGAT

GAATTACTAATCAATTAAGGAATTTTTCTAATAGTAAATAATTTCACGAGATCACGAATTGATGCAATTAATATCCAAAA

TAGGTGGGAATACTGCATTTGTAGATTAGTAATTTATGAAGAAAATAATTAAGATTCCTTGATAAATTACTAATCTACAA

ATAAAATATTCTCGCCTATGTTAAATATTAATTGCATCAATTTGTAACCTTGTGAAATTATTTATTGTTAGAAATTTAAG

GCATTTATGATATAAACTTGTTTTTCACGTGTTATACAACTTGTAACTAACAATAGACAAATTTTATATATATATATATA

TATATATATATATATATATATGTTAATAGTGTTTTATTTGTAAAGTTTTTATCAAAAAATATTTTAGAAAATAAAAAATC

AAGTCTTTCAAACTAACTAGTTTTTTGTGGGATGAATGGTAGAATGATCAATATTTTTCCTTTAAATTTTATGTTGACTA

TTATGTATTTTTGTAAGTATTCACCGAAGTATGTGATTCATAAATATATTTTTGTAAGGTATTCACCGAAGTGTCTGATT

CATAAATATATTTAGTAAGTATTTCTACGTATTAATGTCGTGTTCATAGACGTCAACGTTTGATACTCTTAGATACTCTT

TCTAAGGGAGTAACATTGTTATTTTTTGGTTGAAGGGCCAACTCGTGGCCCACTCAGGTCTGGACTGAGCTGCTATTTTA

TAGGCCCTTTAATTAAAGGATTAATGACAAAAATCCCACATTTAAGTTCTCTTATTACCATTATCCTCTATTAATTTACA

ATTTCCCAAAATTCCTCATTTTCATGCATCAGATCAATGTATCAGTGTATCAAATTAATGTATCTCTCGCATCAAATTAG

TGTATCATGTATAAAATGTATATCATATTAGTGTATCATGTATAAAATGTAATGTATCTTACTTAATGATTAATGTATCT

CGCTCATCAGATTAATGTATCAACGCTCATATTATTGTATCAGTTGGAGGGATTTTTGTAATTATAAACTTATAAGCGAC

AAATGGTAATGTTACCTTAAAAGTATGTGATTTCTGTCATTTGCCCTTAATTTTGATTAAAAGGGTCAGCCCATCCAACG

CGTTTAACTCTGTAGCCCGTTAGGGTTGGATCGGATACTCAGCCTATTTTAATAGCTCTAATGATTATAAATATTTTCAA

ACGAGTGACCAAACACATAACTATTTCCCTCTTTATTTTGTTATGTCTTTCCATGAAACATTAGTAAAAATACTTTCTTA

ATATTTGTGTACTGTCTAACGACTATAAATATTTTCGACAAGTGATCATTTACGTAACTATTTCCCTCTTTATTTTGTTA

TATGTCTTTCCATGATATGTATACTGACTAACGACTATAAATATTTTCTGCGAACGACCAAATACGTAACTATTTCCCTC

TTTATTTTTTTCTTATATATGTCTATCCATGTAAAAATAGTTTTTAAATTCTTGAGTTTAATTTTTGTATATACACATAT

AGGTGGGATGGAAGTGACTTCATGAGAAGAATTAAAAACAAGAAGGTATTATTCGTGGGAGATTCATTGAGCTTGAATCA

ATGGCAATCTTTGGCTTGCATGCTTCATTCTGCCTTTCCAAGTCTTAATTACTCTGTCACCAGAAATGGACCACTCATGT

CAACCTTTTCTATACCCGTAAGTGAATCGAGGTGAATTCAGAATTTAAATTTAATGAATTCGTATGATTTGTGAAGGGTA

TATTATGCATCTTCGTTGTTTTTATTTTTTAAAATTTGAATTTGATGCACTTAAATCGAATATCTATTGAAAATAGGAGG

CAGTAATAACTGATAATGTACAAATATACTTTACCTTTCTAAATCTCATCTAGTGACATTTTGCTGAATACGTTATTGTT

AATATATAGTATAATTATTTCTTTAATTCATTTTTATTTGTGCGTATTGATTTGAGATAGCTCTCAAGGTGCAATATATT

GAATATATATAGTAGACTCAATATTTTGACAAATGATGATAGTTATTAATAAATGATAAATTAACTAGAAATAAGTGATA

TAAATTATTACAAACTTAACCTCTAATATGGGTAATTAAAAGGGTTGACACATAATAATTGGATAAATTGTGAAGATTTC

TTCTTTTTTTAAAAAAATAAAAAAAATAAAAAATTTCCCATGTTTTTGGGGGGAATTGCATTTATGAGAGAAAGGGACTT

GACCTTACCTCATAAAGCACAACACAAGATAAAAATTGTGAATATTAATTGGGGGAGTTGTATTAAGTTATTGAAATAAT

AATTTTGTAACACTTTAGAATTTTTTATTATTTATATTATTAGGTTATCAGTTTGGAAGTATAGAGAAATAAAAAATATA

TATTTCAATTAATCAAATGTAATTATGTATCATACGGATCAACATCGATATTTATTTATATTTCAAGAATTGATAATATA

AAATCTCAAGATATACACACATAACTGATCAGGACCAAAAATACTAGATTCAACTGAACTTATTAACTAAAACTAATTTA

TCTATCCTCTTTTATGCTTAATTTCTCACATTTGTCTTTCAATATAATATTGTTAATGTCAAATTGATAATAATCTCTCT

AATAATGTTTTTTTTAAAGAAATTACATTGTTGAATTTATGTAGTCAAAGCAAGTGAGATTGAGTTATGTGAGAAATGCA

TTGCTAGTAGACATAGTGAAGGAGAAATCAAAAAGAGTATTAAAGTTGGACTCAGTTGCAATTTCTTCAAAGCTGTGGAC

TGGTTATGACATTTTGATATTTGATACTTGGCATTGGTGGATTCATACGGGAAGAAAACAACCGTAAGTTTTAATTTTTA

TGAAAAAATATTAGAGATTTTGATGTCTAAATTGAGAACAACATATTATCGTGAGAGTGTCGAGAAGGTAGAATGTATGT

AGAGAAAATTGATGGACATGGTGGGTCTAAATATAGGGAGAAAATCGTTTTTGTTTGACAAATATTTTTTTAAAATTGAA

ACCGATGGATGTATGTCATAATTCATATCGAAATTTATATGATTGACCTCCTGATGGTCTTTCAGAAACAATATATTTGC

CTGTACGAGGTAATGATAAGCTCATCATAAACTCTATCCTTTTTAGACCCTTACTTAGTTCAATTTCACTGTTTATGTTA

TTGTTGTAGACCCTAGTTTATATTCTGTACAAAATAAATATCAACTAAATTGACACTAATTTTACAGATGGGATTTGATT

CGCGATGGGAAAATCCTACGTCGAGATATGGATCGTTTAAAAGCTTATGAAAAAGCCTTAATAACATGGGGTAAATGGAT

TTCCAACAACATTAATTTCAAGAAAACTAAGGTCTTTTTTCAAGGCATCTCACCTGATCATAGCAAGTAAGATTTCAAAT

ATTTCAAACTTTCGTGTCTGATCAAATAATGTCATATGAATTAACATTTTATTTTTTTACAGTGGCACTCAATGGGGTAA

AAAATCCAACCAAATGCAATGCAAAGGTGAACAAAATCCAGTAAAAAAACTGAGTTACTCAGGAGGTGAAGATGAAGCAG

ATATATTATTGGGGAAAATATTGAGCAAAACAAAAAAGCCAATACATATGTTGAAACTCAACAAAATGTCACAATATAGA

GTTGATGGTCATCCTTCTATTTATGGTAACCCTAGATATAAAGGAATGGATTGTACACATTGGTGTTTACCTGGTGTACC

TGATATTTGGAATCAACTTCTTTATGCTAATCTCATT

Predicted coding sequence

ATGAAAAATTCTCTAATAATTTTTCATAATTGCTTCTTCAAATTACTAGTAATTATAATCAACATTATTTTGTTCATCAA

TAATAATGTTGATTTTCTAGTAGAAGCAAAACAAAACAAGCTACTACATCCTCCCTTCAAAAAAAAGGGTGCAAATTGTG

ATTTATATGATGGAAAATGGGTTATTGATTATAATTATCCACTTTATAATGCAAAAAATTGTCCATTTTTACTTCAACAA

TTTGATTGTGTAAAGAATGGTAGACCAGATAAAGCATATCTCAAGTATAGATGGCAACCCACAGATTGTAACTTAGCCAG

GTGGGATGGAAGTGACTTCATGAGAAGAATTAAAAACAAGAAGGTATTATTCGTGGGAGATTCATTGAGCTTGAATCAAT

GGCAATCTTTGGCTTGCATGCTTCATTCTGCCTTTCCAAGTCTTAATTACTCTGTCACCAGAAATGGACCACTCATGTCA

ACCTTTTCTATACCCGTAAGTGAATCGAGATTGAGTTATGTGAGAAATGCATTGCTAGTAGACATAGTGAAGGAGAAATC

AAAAAGAGTATTAAAGTTGGACTCAGTTGCAATTTCTTCAAAGCTGTGGACTGGTTATGACATTTTGATATTTGATACTT

GGCATTGGTGGATTCATACGGGAAGAAAACAACCATGGGATTTGATTCGCGATGGGAAAATCCTACGTCGAGATATGGAT

CGTTTAAAAGCTTATGAAAAAGCCTTAATAACATGGGGTAAATGGATTTCCAACAACATTAATTTCAAGAAAACTAAGGT

CTTTTTTCAAGGCATCTCACCTGATCATAGCAATGGCACTCAATGGGGTAAAAAATCCAACCAAATGCAATGCAAAGGTG

AACAAAATCCAGTAAAAAAACTGAGTTACTCAGGAGGTGAAGATGAAGCAGATATATTATTGGGGAAAATATTGAGCAAA

ACAAAAAAGCCAATACATATGTTGAAACTCAACAAAATGTCACAATATAGAGTTGATGGTCATCCTTCTATTTATGGTAA

CCCTAGATATAAAGGAATGGATTGTACACATTGGTGTTTACCTGGTGTACCTGATATTTGGAATCAACTTCTTTATGCTA

ATCTCATT

Predicted protein sequence – 376 amino acids

MKNSLIIFHNCFFKLLVIIINIILFINNNVDFLVEAKQNKLLHPPFKKKGANCDLYDGKWVIDYNYPLYNAKNCPFLLQQ

FDCVKNGRPDKAYLKYRWQPTDCNLARWDGSDFMRRIKNKKVLFVGDSLSLNQWQSLACMLHSAFPSLNYSVTRNGPLMS

TFSIPVSESRLSYVRNALLVDIVKEKSKRVLKLDSVAISSKLWTGYDILIFDTWHWWIHTGRKQPWDLIRDGKILRRDMD

RLKAYEKALITWGKWISNNINFKKTKVFFQGISPDHSNGTQWGKKSNQMQCKGEQNPVKKLSYSGGEDEADILLGKILSK

TKKPIHMLKLNKMSQYRVDGHPSIYGNPRYKGMDCTHWCLPGVPDIWNQLLYANLI

P049P16 heat shock protein gene based on segments of chimeric unigenes U314912 and U314913 and P049P16 sequence corresponding to At1g06460. Five introns predicted downstream of the start codon/upstream of the stop codon. Protein coding sequence shown in bold type.

ATGGAGAGTCAAATTGTTCGACGAAGAGTTAACATGATTACTGCTCATTTAACTGCACATGATGATATTTCCGCCTCCGC

TACTCATCTCTTTCCTATGGTAATCTCTTTCTCTGTCTCTACTCATAGTAATGTTAGCAGGGACGGAGTTACAGGTTCGA

TAGAACTAGTAGCTTTCGCCAGCATTTCGTATTTATGTTTAAAAAATTATGAATAGTATAATTTATTTGAAGTAAAGTCA

AAGGTGTCTTTACGAGAATCCAGAACCTCTGAATGGTAGGACTTGTCACGAGCTAATTTGAAAATAAAGTAATCTACTCA

TAGCCCTTTGGTTAAAGTCATACCACTATTCATTTCCCCTGTTTCTTTTAACTATATATCTATTGATGTGCTTCTATTTG

ATTTTTCACTTTGTTTACTGTATAGAGCTGTAGCAGTAGCTTGAATTCTGCTATTCCGAGGAGGTACGATAACAGAATGA

ACTATGCAAGACAAAGTTCCAGTTCTCAAGCTTGTTTCATGAGGACAAGTGAACAGGTCTGGGAATTATTACTAATATAA

TTGACATTACTTTAGTTTCAATGAGTTTGTAATATTCGTTCTGCAGGTGTTAGCTTTTTTCATTTTTTTTTCTTGCTTTG

GGAGCAGGGAAGCTGTACTGAATCCACTGCGGCTTTCAAGGCTAGTGATTATGCAAAGAAGAGTTCTCGCGCCTTTGAAG

GACCAATGTTTTCTAGACCTGCAAATAATTGCAAACACAATGGAACTGTTGAAGAAGCTCCTAAATTTGCTAGGCCTCGT

TTCCAATTGAAAGAAAGAAGAAATGAACTTGAATCTAATGGTAAACAAACCTATGCTTTACTTTTGATTGTTATATCGCG

TAATTGAGAGGTACGTCCTCTTTGGAATGTTGAAACATTTCCTTTTGTTTTTGCTAATGCAGGGAGTGAATGGTCTCCTA

AGATGGATGTTGCAGAATCTGGAAGCATGTACGTCGTATCTATAGAACTTCCCGGTGTCAATATAAATGATATAAAGGTC

GAAGTCAGCCACAAAAGGTAAATAAATGACAACTATCCATTAGTCTTTCTTTGATTTCTCGTATAGTCACTATTATCTCA

GAATGTCAATTTCTTTGTGAGATCAGCATGTGTTATAAAGTTCCATCTTCTGCAAAGATGAATTCAATTTGCGTTGATCT

AATAGACGCGTGTTATGTTCCTTGACAGCTTAATAGTTTCTGGAAATCGTTCCACTCAGTGTAAAGTGGCATCATACTTG

AATGGCTTGGTATCAGCCTATCATAAAAAGGAGATTGTTCAGGGACCATACCGTGTTTTCTGGCCTCTTCCAAGTAATGC

TAATAAAAATCGCGTCTCAGCTGAGTTTGTGTAAGTTATCAATATTTGTGATTGTTTACCTATATATCGCCATGCTTAAT

GTTTTTAGTCGAGAAAAAACACTTCGTTACATATAGACTTGTGAAATTTCATGACTCTAAAACAATGCAGGGACGGACTT

TTACAGATTACAATCCCGAAACTT

Predicted coding sequence

ATGGAGAGTCAAATTGTTCGACGAAGAGTTAACATGATTACTGCTCATTTAACTGCACATGATGATATTTCCGCCTCCGC

TACTCATCTCTTTCCTATGAGCTGTAGCAGTAGCTTGAATTCTGCTATTCCGAGGAGGTACGATAACAGAATGAACTATG

CAAGACAAAGTTCCAGTTCTCAAGCTTGTTTCATGAGGACAAGTGAACAGGAGCAGGGAAGCTGTACTGAATCCACTGCG

GCTTTCAAGGCTAGTGATTATGCAAAGAAGAGTTCTCGCGCCTTTGAAGGACCAATGTTTTCTAGACCTGCAAATAATTG

CAAACACAATGGAACTGTTGAAGAAGCTCCTAAATTTGCTAGGCCTCGTTTCCAATTGAAAGAAAGAAGAAATGAACTTG

AATCTAATGGGAGTGAATGGTCTCCTAAGATGGATGTTGCAGAATCTGGAAGCATGTACGTCGTATCTATAGAACTTCCC

GGTGTCAATATAAATGATATAAAGGTCGAAGTCAGCCACAAAAGCTTAATAGTTTCTGGAAATCGTTCCACTCAGTGTAA

AGTGGCATCATACTTGAATGGCTTGGTATCAGCCTATCATAAAAAGGAGATTGTTCAGGGACCATACCGTGTTTTCTGGC

CTCTTCCAAGTAATGCTAATAAAAATCGCGTCTCAGCTGAGTTTGTGGACGGACTTTTACAGATTACAATCCCGAAACTT

Predicted protein sequence – 240 amino acids

MESQIVRRRVNMITAHLTAHDDISASATHLFPMSCSSSLNSAIPRRYDNRMNYARQSSSSQACFMRTSEQEQGSCTESTA

AFKASDYAKKSSRAFEGPMFSRPANNCKHNGTVEEAPKFARPRFQLKERRNELESNGSEWSPKMDVAESGSMYVVSIELP

GVNINDIKVEVSHKSLIVSGNRSTQCKVASYLNGLVSAYHKKEIVQGPYRVFWPLPSNANKNRVSAEFVDGLLQITIPKL

P049P16 heat shock transcription factor based on P049P16 sequence homologous to GSVIVP00018812001 and the part of the coding sequence contained in SGN-U326545. One intron predicted downstream of the start codon/upstream of the stop codon. Protein coding sequence shown in bold type.

ATGGATAACTGTAATGGAGGATCAAGTTCTTCTTCTCCGGCGCCTTTTTTGTTGAAAACTTATGAACTGGTTGATGATTC

GTATACTAATCCAGTTGTTTCATGGAGCCATAACGGACGTAGCTTCGTTGTTTGGAATCCACCTGAATTCGCTAGAGATT

TGCTTCCGAAATACTTTAAGCATAACAATTTCTCAAGTTTTATCAGACAACTTAATACTTATGTAAGTAAAATTATTTCG

TAAAAATATCTCTATCGAATCATCACCAATTGTGTTTTGTTATTTGACGATATTCATTTATTTCTATTAGGGGTTTAGAA

AGGTTGATCCTGAACAATGGGAGTTTGCGAACGAGGATTTTTTAAGAGGACGTAGACATTTGTTGAAGAATATTTATAGA

CGAAAGCCGATCCATAGCCACTCTGCTGCAGCAGGAACAGGGCAATCTGTAGCTCCATTGACGGATTCTGAGAGACAGGA

GTATGAAGATGAAATCGAGAGGTTGAAGAGAGAAAACAGTCTTCTTCAGTCGTCTGCGGAGAATCAATTGAAATTCAATG

GGGAGTACGAAAGTGGAATTAAGTCTATGGAGCAACGTTTACAGAACGTTGCTCATAGACAGGGGAAATTGATTTCTCTT

TTAGCTCAATTACTACAAACACCTGGATTTTCATCTGATTTCACTCAAAGCGCGAGCAGGAAGAGACGATTGTTGATATC

AAATTACTTGATTGACGAGGAAAACTCACCAAAATTCGACTTGGAAATGGTTAAAAAGTTGGATTCATCAATCAATTTTT

GGGAGCGGTTTCTGTATGGTGTTCAAACACAAGATTTCGAGCATACACATTCCCCAATTGTTACACATACATCATCTAAT

GATTCTGCCAAACGAAACTCTCCCATCGATCATTCACCATCCTCCTCCGAGTTAGGGCCATTGAATCCTGTCATGTCATC

AACTTATGAAAATTTAGAACGTCAACTTAAGCCATCTGATAATCAGATTGAGTGTAAGACCAGTAAAACATCTGAATTAG

TATCAAACTCGGGTAATGATGTATTTTGGCAACAGTTCTTAACAGAGACGCCTGGTTGCACTGAGCCACAACAAGTTGAG

AACAAAGGGATAAACGAATCAACGCGTGATATTAGATTAGGGGATAGCCATAGATATTGGTGGAATCGCGGAGTTAATTT

AGAAAATCTTGCTGAAAGAATGGGACATCTTAGTAGTCCAGCAACAGGAAGC

Predicted coding sequence

ATGGATAACTGTAATGGAGGATCAAGTTCTTCTTCTCCGGCGCCTTTTTTGTTGAAAACTTATGAACTGGTTGATGATTC

GTATACTAATCCAGTTGTTTCATGGAGCCATAACGGACGTAGCTTCGTTGTTTGGAATCCACCTGAATTCGCTAGAGATT

TGCTTCCGAAATACTTTAAGCATAACAATTTCTCAAGTTTTATCAGACAACTTAATACTTATGGGTTTAGAAAGGTTGAT

CCTGAACAATGGGAGTTTGCGAACGAGGATTTTTTAAGAGGACGTAGACATTTGTTGAAGAATATTTATAGACGAAAGCC

GATCCATAGCCACTCTGCTGCAGCAGGAACAGGGCAATCTGTAGCTCCATTGACGGATTCTGAGAGACAGGAGTATGAAG

ATGAAATCGAGAGGTTGAAGAGAGAAAACAGTCTTCTTCAGTCGTCTGCGGAGAATCAATTGAAATTCAATGGGGAGTAC

GAAAGTGGAATTAAGTCTATGGAGCAACGTTTACAGAACGTTGCTCATAGACAGGGGAAATTGATTTCTCTTTTAGCTCA

ATTACTACAAACACCTGGATTTTCATCTGATTTCACTCAAAGCGCGAGCAGGAAGAGACGATTGTTGATATCAAATTACT

TGATTGACGAGGAAAACTCACCAAAATTCGACTTGGAAATGGTTAAAAAGTTGGATTCATCAATCAATTTTTGGGAGCGG

TTTCTGTATGGTGTTCAAACACAAGATTTCGAGCATACACATTCCCCAATTGTTACACATACATCATCTAATGATTCTGC

CAAACGAAACTCTCCCATCGATCATTCACCATCCTCCTCCGAGTTAGGGCCATTGAATCCTGTCATGTCATCAACTTATG

AAAATTTAGAACGTCAACTTAAGCCATCTGATAATCAGATTGAGTGTAAGACCAGTAAAACATCTGAATTAGTATCAAAC

TCGGGTAATGATGTATTTTGGCAACAGTTCTTAACAGAGACGCCTGGTTGCACTGAGCCACAACAAGTTGAGAACAAAGG

GATAAACGAATCAACGCGTGATATTAGATTAGGGGATAGCCATAGATATTGGTGGAATCGCGGAGTTAATTTAGAAAATC

TTGCTGAAAGAATGGGACATCTTAGTAGTCCAGCAACAGGAAGC

Predicted protein sequence – 388 amino acids

MDNCNGGSSSSSPAPFLLKTYELVDDSYTNPVVSWSHNGRSFVVWNPPEFARDLLPKYFKHNNFSSFIRQLNTYGFRKVD

PEQWEFANEDFLRGRRHLLKNIYRRKPIHSHSAAAGTGQSVAPLTDSERQEYEDEIERLKRENSLLQSSAENQLKFNGEY

ESGIKSMEQRLQNVAHRQGKLISLLAQLLQTPGFSSDFTQSASRKRRLLISNYLIDEENSPKFDLEMVKKLDSSINFWER

FLYGVQTQDFEHTHSPIVTHTSSNDSAKRNSPIDHSPSSSELGPLNPVMSSTYENLERQLKPSDNQIECKTSKTSELVSN

SGNDVFWQQFLTETPGCTEPQQVENKGINESTRDIRLGDSHRYWWNRGVNLENLAERMGHLSSPATGS

P049P16 phosphate translocator gene similar to At1g06470. Nine introns predicted downstream of the start codon/upstream of the stop codon. Protein coding sequence shown in bold type.

ATGAAGGGTGGTGGTGATTTGGCTGTTGCATCTACTACGAATGGAAAAGATAGATATGTTCCGTTTGATGTGGAGAACGG

TTCTAGAAGTAATCAAACATATTCAAATGTGCACGGGGAAGGATCTACTCATCTGGACCACCACGGTGCATCACAAACAA

AGTCAAAGAATGTTGTTTCCGTAGCTGATGTGCTGAAGACACTGTTCTTAGTCCTTGTATGGTACATATTCAGTACATTC

TTGACATTGTAAGTCTACTTGGTCATGAGCTTATGATTTTACTAAGTTATTTGTTTTCTCTTATCTGTGTTGAAGCTTTG

GACACATTGGTTCTTATCTTGCATTCATTTGGTCTAGGTATAATAAAACTCTTCTAGGGGATCATCTAGGGAGATTCCCT

GCTCCTTTACTGATGAATACATTCCACTTCGCAATGCAAGCCATTTTGTCCAAAGGCATTACTTGGTTCTGGTCCCGAAA

ATTTCAACCCACTGTAAAGATGACTTGGAGAGATTATTTTTTGAGAGGTAACTATGATTGTCAATTTGTCATATCCTTTT

TCTTTAAGCTATACTGAGATACAGGTTATATTTGTTTTATGCGTTATTATGGGTTTTCAACAGACTGTTCATTGTTTTCT

ACTGTGTGATTATAAATAGCTCTAGATGCAAGGAACTGTTCTGACCTTCAGTTCCTTTAAAGAAATCAGTAGAGAAACAG

AGACCAGAGTAGGTAAGATAAAAATATTGAAATATTTGAGATTGTATGCCAATTTATTAGCAGGAGATTGTAACCCAAGG

GTTCTATATTAGGCACACTTCTTTTCTTGTAAAGTTTGTCTGTAAGATTCATTATTGGGAAGACAAACTGCCTGATCCTT

GCTAGTTCTGTTACCTTTCTCAAAAAATGATCCTTGCATAGTTCTGTTACCTTTCTCAAAAATGATCCTTGCATAGTTCT

ATGTTCCCAGTTCGAACACCTTTTTAACTTGTGGCTTCAACTAGCAAGCCACTTAGCACAACCCCACATTTCTTTTTTGA

ATTTTAGTTGTAAAAACAACAGGAAAATGAGTTCTGAGATTTGTACAATGATGAATGACTAGTAACGCCTATTTATGATT

TAGGAGTCATTAAAGTCCGAAAAAGTGTCAGACTAACTTACATCTATCACGCACCTCAAAAGATAAAGATGGTTAACACC

TAAGCTCTATAGAGAACCTAGAGTTCCTCTCCTTCCACCCTATCCATACAATGTACAATTATAACATTCCGTAGGACTTT

AGGTTGCTTTGGTTTCTTCGGGCCTCTCTTGTTGATGACCTCCTTTAGATGAGTATGACTTTGATACGGATGATAAGAAA

TGACCTTGGTGCCTAACTCAACTGCAAAAGTTAGCTCATAATGTGGGGATTGTCCAAGACCATATAATGAGACCAATTAT

AAGCATTTAGATGAAATGGTTACACAATTCAACATGATATAAGAGGCAGAACATGTCTTGGGTTCGAGTCTTACTGCTAT

CCTTTATCAAAAAGAATTTCCATGTGGTTGACTCATAAAAAAGAATCAACCCTCAAGTAAGGGGGCGTGTTGAATATATA

ATAAAATACATAAATGTGTATTCTATCTAACAAGTTAAGCTTTTAGATAAGATTATTGCACACTTCAACATGGTATTAAA

GCAGCCGAGGTCTTGGATTCGGGTCACCACCATCAATTATCAAAAAGAGTTTCCACGACCCCCACTTGAGAAGATTTGTT

GATAACATATATTTTTAATAAGAAAAGCAGTTATTAAAATGCCTGCAAAGGGAATCGTACTCGGACACATAAAAAAAATA

AAGAATTTTTTGCGGCCTGCATGAATTAACGGCACCCAAAGCTGCTTTTGTGCATTGAAGCATATTTGCTCTCTCTGACA

TCATAAAGTTGCATTGCTCGTTCTTCTTTTATTTAAAACATTTAATCTTATGCCCTTTATTTGAAGCTGTTTTGTGAAGT

CTAGAGCATTACTTCTAGATATTGGCCTCCAATAGTTTCCTGCCAATTTTTATTGACTTTTCTGACAACTAATGCTACAG

ATGGCCTTTGCCTTTCACAGTTGTTCCCACAGCTCTCAGTACGGCAATGGATGTCAACCTAAGCAATGCATCCCTTGTTT

TCATATCAGTGACATTTGCTACTATGGTGTGTATTCGTTTTCCCTGTAAATTTTAACATACCAATCAAATGGTCAACAGA

TTTGTTAAGAAAATTAAGTCACTGGGCAAACTCAAAAAGGATTCTCACAACCCAGCATTCCTTTAGGTCTGTAGAAGCAC

TTCCGAATTCTAACAACAATTTGTGAGATTGCAATAAGAATAATTTTCAAAGACTTGAAGGGAGAGTTAGTGAAACGATC

TTCAACTATTACTCGTAAAAAAGAATAATCCTCTAGTTTCCTTCATTTTCCTCCATAAATTCTTGACTCCTAAACACAAG

TTTGTCATTGCAGTGCAAATCTGCAGCACCGATCTTTCTCCTACTCTTCGCTTTTGCTTTCAGGTACTTCATTTAATCAT

TGCTCTATTTTTCATTGAGTCTTTACTATATTTAATAGATGCATCTCCTGTTGAATTATTCGTCAATCTGCATAGTAACT

ACTTGATATGTCTTAATGGACACTCCTCTTTTTTTAGTCTGCTTTAAAAGAATGCCATATTTCTACAATTCAAAGTGCTT

TTTGGCTGTAAACTTTTCACTTTACCCGCAATTATACGCAGTTAAAGCCATAGAAATATTATGACTTGTATACGACAATA

ATTTCTAAGGGTAATTTTGGTATGTGCCAGAAGTCTGTTTTCTCTCTCTTAAACTCTGCATAACAAAAACTCTGCCATAT

ATTTAATGGAGGGAGTAGCCATTTTGGCATATAAGGATCTTCAATTTTTGACGGACTGTTTCTTGTCCAGGAAAAAAAAA

TCTATATAGTCCATCTTTAAGCTCAGTCTCCATGAACTCAAAGGAAGCAGGATACAACCATCACTTGTTGATTTTCAATT

AGTCCCTCATTAGTGGTACACATACTGAGAAAGAAGTCTTTTTCCTGTCCATTGCATACTTGACCCTTCAAGCATTAAAT

TTATCATCCATCTCTCATGAATGATTTCATTTGCTCTCTCTTAAAAATGAGTTCTTATTTGAGTATATTTGGTCTACTGC

CTTGTTTTTAACCTCATATTTTTTTTGAAAGGTTGGAGTCTCCGAGTTTGAAGCTGCTAGGGATCATGTTGATTATTTCT

ATTGGGGTATTATTAACAGGTATCCTATACACTTATTAGCATATTTGTTTGTTCTTTCTTCCTTTTTTTTAATTTTATTT

TTGGGTAATATCAGTTATGCACACGCTAGGTAGCTTGTCCTTGTGAAGGTAATCTGACTTACCAATGCTGGAACCGATAG

ACTCACTCATACCTAGTGTTGTAGGAACTCAAACCTGGGATCTCCAGGTTGGGCCTCAACCAATGAGCCATCCCTAGCTT

CTTAACTTTTGAAGATCTCCCTATTTATCTGCCACTTTTCTTATATGACATTAATAATTCTCATTTTGTATGCTGGTAAA

AGTAGTGCTTTGAGTCTATATGTGTTTCAGACTTATTGTTTTCTATTCTATTTTAAAAATCATGATCCATGCATGACTAT

CATTTTTTGTTTAAAAATAACAAGGATGGGACCGAAATGTGCTGGACTCGATATGAATTTCATTTGTTTCAATTACATTT

CTCCATTGTCTTGGCTGTAGCCTTTAAAAATCATTACTTTTTATAAGTAAGTTTTTACTTTCTTAAAATTAAGAAAGGAA

TATTTTGGGGCTCGAGTTTCTAGAATTGCTATTTCATACCTAATAATCTGACTTTCTATCCTCTTCATTTGTTTTAGTCA

TGACACATTCTCTTTTCAACTATAAGGTGGCTAAAAATATATATATTTATACAAATACTCGCTGGAATGAGAAAGTTGAG

ATGGATACTATGTTGAACAAGAAAGGAAAGGTACAATAACACAAGTATTGAAAATGCGGAGGATAGTGATTGGGTAGTGG

CTCCACTAGGTAGTGTGAAGAAATAGTTTAAAATCATTCTCATTTCACAGTTTTTCTTATAGCAACGGTGATATCAGTTG

GAAAAAGCACTTCTAATACCACTGATGCGAAGAGTAAAAAAAAAAATCGTAACAAATGAGATGCCAAGAGTAATTGCACC

TAAAGGTGTGGCCTAGTGGTCAATAAAGTGGATGCAAACCTTGGAGACCCAGGTTGAAATTGCAGTAGAAGCAAAAGTAC

TTGGTGATTTCTTTGTATTTACCCCTTAAGAGAGTTGAGTTACTTGGTAGTTGTGTTGGCGAGAGGTAGTAGGTGGAATA

GCAGAGATGCGTGCCAGCTAGTATGGACACCAAAAAGGGAGATGAAAAGAGTAATTTTAGAGAAATGTCATGACTTATTA

GTCAATAATATATACATTGAATGTAGATAAAAGAAAACCGAGAAAAATGGAACTTACGCAGCATAGATGAATATATAAGA

AAATGCCGAAGTAGTTTGTGGTTCTCTTCAAAACTCTCTCTGTCCATTTTTTTTACCTTGTTATTTTCAGTTTTTTGAGT

GCTTAGCTACTTTATATGTTGTGATTAATTCTGTTGTCTGTAGACGGATATATGTTCAATAAGCACATCTGACCTTTATT

TATCGACAATACAGTTGCAAAGGAAACGGAGTTTGAATTTTGGGGGTTTATCTTTGTTATGCTAGCTGCTGTTATGTCTG

GGTTCCGCTGGACTATGACTCAGATACTTCTGCAGGTAGGATTCCAGAAATTGTTAAAAGTGAATTTGTTTTTAAAGTAT

TTTCATCATCATACTTGTGCTCACTTTGTTTATTTTGTGTTCATTCTCCTGTACTCCATCCAACGGGCGTGCGCTGACCA

AAAACTGTCATAAAGAAAGAAATCTACGGTAAGGACTTCCAGCAAATTATAGCTAGCTATCAAAGCACTGAAAATGAATT

TATTCGTAGAGTATTTCTGTTGATTAATATTGTTGGTGGATGATTGCATGTTGGTGACTCAGTTCTTCATTTACCTAGTT

TTGGATTCCCCTAAAAAGTATTCTATTTATTATTTTTGTTTTGTCACATTTTGTTTTAACCCTAGTCTGGCCAAATTTGA

TAGTTCAATTTTTTGTTTGGATAGTTTAAGTTCTGGTAAGCAACATTTATTGCAGGTGGAATTCATAGATAGCCTCTTAA

ACTTGCCACCAACTGCCAAGTGTACACTTAAGTATACACCTTAACTATTCAGTGATCAGTTAGACACCTCTTTCTGGCAG

AACTTTCTCATGACCCCTCAAGATGACATGGCAAAACACATTATTTTCAGTCGAATTTGAGCGCATGAAGCTCCTTAAAA

TTTGACTCAGTACTTAGAGTGCAAGTTCAGGGACATAATTCACGTGTCAGATGTGGAGGTGAAAATCGGTACACGTGTCA

TAATCAAAAGAGAGTTTCAAGTATCTTGAGTCAATAATCCAAGGAAGTGGGGAGATTAATGATGATGTTACATATCGTAT

TGATACATGGTGGATGAAATTGAGGCTCACATCCGGTGTCTTATGCGATAACAAAGTGGTTGTCTCGTATTGCCGCAGGA

GTTAGACAAGTTTTTTCGGTTCCAAGTCTCGCGTCCATACTACTTCGTTAAATTTTCCTCTGACTTTTACAACCTTATTT

ACAAGGCCTTAATTCTTGGAGGAAAGTAACAAATTTCCTGTCAGTGGCCCGATCCCATAAGAGCATTTCATAAGCTTGTG

AGAAAGTTCAAACTAATGTAGTGGTCTTTTGATGCCCCATCCACACTTTCCCAAGAAATGCACGAAGTGCTTAGTCTTTT

TCTCGGCACTTATGGGACCTGTAAACAAAAATAAGTAGTACATTGGAATTATTAAAATGTTAAGCCAGATAAAAGTGAGT

ACGCTCTCTGAGTTCAAAGAACAATTTTCTACTCATCTAATCTATAAGGCATTCTTTGAGTTGCACGAATCCCGAACACT

CCTTCTGTCTTAATTTAGGCGACCCTCTCTGCTTTTTAGTCAATCCCCCTCCAAAATGGCTCTCTTCTATATCTAGTTAC

AATTTAACTTTAAACTTCTCATTTTGATCCTTGATAAGGTAATTTATAGCCACACAAATATCTATGGCTTGTTTTAGACC

ACAAATTTCAAAAATATTTTTTTCAATCATAAACTTCGTGCTTATTCAAACACCTTCACATAACAGAGGGAGTTATCGTT

GTGTTTCTTTCTGGCAAAGTCATGTTTTACTTTTAAGAAAAGTAGCTAGTTGTAATTTAATATAGTGAGATATGTCCTTT

GAAATATTAACCATGTAGCTTGTATATACGCTGTATATGTCAACACTTTCTTCTGTTTTTTCAGGTTTAAAAAATCCACT

CACACTAATGAGCTACGTTACTCCAGTAATGGCTCTTTCAACTGCTATGCTGTCTCTGATTTTTGATCCATGGCAAGAGT

TTGGAAGCAGCAGTTACTTCGATAGCTCATGGCACATAACTAGAAGTTGTTTGCTGATGCTTTTTGGTGGAACCTTGGCT

TTCTTTATGGTATGCATGTATCTGACTCCATGTCAATAAGTCCAAATTGTTGATTATCCAACATTCTAGTGGCAAATTTC

TTTGCTGGCTCTTTTCCATTTGCAGAAAGTTGTTGTCTACTAAAATACTATAATATCTAAAAGCAAAAACAAATTCGATA

GACCTTCTATGCATGTTGTACAAATGATTCTTCCTCTGCTTTTTTTTTTCCAGGTGTTGACGGAATATATTCTCGTCTCT

GTTACTAGTGCAGTAACAGTGACAATAGCAGGAGTCGTAAAGGAGGCTGTCACTATCGTGGTATAAGCTAAAAACCAAGT

TATCTATATCTCTTTTCTTTAGTGAAGTAATTTAACTGACTTATCAAAGAAAAAAGAGCATACAAGTAATGTAGCTGAAT

AACTGGTTTAGTTATTCAAATTTCATCAGTTACCTGATAGCAGTTTACTCTATGGAATTTGTAATTTGTTTCTTCTCGAT

GAACATTGAGATTGTTAATTAAAAATCCTGGAAATTTCTTCCCCAGGTCCCGTGAATGGTTATGTAGGATGTAACTGCAA

TTTTTCTGCTACAAATGCTTATATTGCTCAGACTTCATTTTCCTAGATATCTTCACTTCAAGCTACTGTGTATCTTCAAT

CGAATTAGACTGATATCAAATCAGTTTTCACAAGTTGAAAAGTATCTCTGATTTTTGGAATCTGTTGTTGCTTCAGTTTC

TGAAACTAATTGGCAATTATGTCGGTGGCATTTTCAGGTTGCTGTGTTTTACTTCCATGATAAGTTTACCTGGATGAAAG

GGGTCGGTCTCATCACAATAATGTTTGGTGTGAGTTTGTTTAATTTGTACAAGTAAGTTTATGAGCTCTCATATTTTTGC

GAGAAGTTGTCATGTGATTTTTGTCTCCCAACTGCTGTTGATATTAGATAAATTTTCTCTTTAACGACCTACTGTGGATG

TCTATCCTTTAATTTTGCGACACCGCTTTGCATTTAATTTCAACTTATCTAGTATTTTTACTAGCTCTTGAATATTCTTT

TATAGCGTAGCCAGGGTTTTACGGGAAACATGTCGGTGACATATTCCACTTGAGTGACAGCATCTAGTCAAACTGTACTT

GTTAATAAGTGGTCTTGCAAATCGCTAATAATATAGGGTTGTCATGAAAATTATAAGAAGATTTGAAGTGTCAGATTGTT

TTTGCTAGGTATTAAATTTGTTTTCTGCTTCCTCTTCTCAGGTATGACAAATTACAGAAAGGTAATCCAAATGAAGATGA

AATTTCACGATCCTCAATGCAAAATGAGGCTGCAAAGTATGTTATTCTTGAAGAATTGGAAGATCAAGATGATGGTCCT

Predicted coding sequence

ATGAAGGGTGGTGGTGATTTGGCTGTTGCATCTACTACGAATGGAAAAGATAGATATGTTCCGTTTGATGTGGAGAACGG

TTCTAGAAGTAATCAAACATATTCAAATGTGCACGGGGAAGGATCTACTCATCTGGACCACCACGGTGCATCACAAACAA

AGTCAAAGAATGTTGTTTCCGTAGCTGATGTGCTGAAGACACTGTTCTTAGTCCTTGTATGGTACATATTCAGTACATTC

TTGACATTGTATAATAAAACTCTTCTAGGGGATCATCTAGGGAGATTCCCTGCTCCTTTACTGATGAATACATTCCACTT

CGCAATGCAAGCCATTTTGTCCAAAGGCATTACTTGGTTCTGGTCCCGAAAATTTCAACCCACTGTAAAGATGACTTGGA

GAGATTATTTTTTGAGAGTTGTTCCCACAGCTCTCAGTACGGCAATGGATGTCAACCTAAGCAATGCATCCCTTGTTTTC

ATATCAGTGACATTTGCTACTATGTGCAAATCTGCAGCACCGATCTTTCTCCTACTCTTCGCTTTTGCTTTCAGGTTGGA

GTCTCCGAGTTTGAAGCTGCTAGGGATCATGTTGATTATTTCTATTGGGGTATTATTAACAGTTGCAAAGGAAACGGAGT

TTGAATTTTGGGGGTTTATCTTTGTTATGCTAGCTGCTGTTATGTCTGGGTTCCGCTGGACTATGACTCAGATACTTCTG

CAGGTAGGTTTAAAAAATCCACTCACACTAATGAGCTACGTTACTCCAGTAATGGCTCTTTCAACTGCTATGCTGTCTCT

GATTTTTGATCCATGGCAAGAGTTTGGAAGCAGCAGTTACTTCGATAGCTCATGGCACATAACTAGAAGTTGTTTGCTGA

TGCTTTTTGGTGGAACCTTGGCTTTCTTTATGGTGTTGACGGAATATATTCTCGTCTCTGTTACTAGTGCAGTAACAGTG

ACAATAGCAGGAGTCGTAAAGGAGGCTGTCACTATCGTGGTTGCTGTGTTTTACTTCCATGATAAGTTTACCTGGATGAA

AGGGGTCGGTCTCATCACAATAATGTTTGGTGTGAGTTTGTTTAATTTGTACAAGTATGACAAATTACAGAAAGGTAATC

CAAATGAAGATGAAATTTCACGATCCTCAATGCAAAATGAGGCTGCAAAGTATGTTATTCTTGAAGAATTGGAAGATCAA

GATGATGGTCCT

Predicted protein – 404 amino acids

MKGGGDLAVASTTNGKDRYVPFDVENGSRSNQTYSNVHGEGSTHLDHHGASQTKSKNVVSVADVLKTLFLVLVWYIFSTF

LTLYNKTLLGDHLGRFPAPLLMNTFHFAMQAILSKGITWFWSRKFQPTVKMTWRDYFLRVVPTALSTAMDVNLSNASLVF

ISVTFATMCKSAAPIFLLLFAFAFRLESPSLKLLGIMLIISIGVLLTVAKETEFEFWGFIFVMLAAVMSGFRWTMTQILL

QVGLKNPLTLMSYVTPVMALSTAMLSLIFDPWQEFGSSSYFDSSWHITRSCLLMLFGGTLAFFMVLTEYILVSVTSAVTV

TIAGVVKEAVTIVVAVFYFHDKFTWMKGVGLITIMFGVSLFNLYKYDKLQKGNPNEDEISRSSMQNEAAKYVILEELEDQ

DDGP

P166A09 cytochrome P450 sequence similar to At3g14610-90. Four introns predicted downstream of the start codon/upstream of the stop codon. Protein coding sequence shown in bold type.

ATGGAGATTTTGTATAACACAATTATAGCAATAATTTGTGTTGCAATATTGTTGGTATATACATGGAGAGTGTTGAATTG

GGCATGGTTTAGGCCAAAAAAATTGGAGAATTTCTTAAGGCAAAGAGGTCTAAAAGGAAATCCATATAAGTTACTCTATG

GAGATTTGAATGAACTCACAAAAAGTATAGTTGAAGCTAAGTCTAAGTCAATCAATATCTCTGATGATATAACTCAAAGG

CTTATCCCTTTTTTCCTTGACTCCATCAACAAAAATGGTATGTTTATTTTATTGATTCGACTAGAAAGTAAACACTGCAA

CTTTGAGTATGCATGTCTAAACACCTTAACTTTATGTGATTCGTTTATCTAAACTTTATGTGTCACGTACGAGACACGGT

GGAGACAAGTTGGAAGTGTTTAGTTGCTAGTTGGACCAAGTTTAGGAGTCTAGATTTGCACCTCAAAGTTGGAGTGTTTA

CTTGTCAGCTGATATCATATTTGAGTGTTTGTTTATGTAGTATATGCCTTTTTTTATAATTGAAAATGGATTTTTGGCAG

GTAAAAGTTCTTTCATGTGGCTAGGCCCATATCCAACAGTGTTGATCACAAATCCTGAACATGTAAAAGAGATTTTGACA

AAGAATTATGTGTACCTAAAGCAAACTCATCCAAATCCATTTGCAAAGTTATTGGCTCAAGGTCTTGTGTTGGTTGAGGA

AGACAAATGGGCAAAACACAGAAAAATAATCAATCCTGCTTTCCATGTTGAGAAGTTAAAGGTTAAATATACTTCTTTTT

TGTTGTATTGAATTGGGATATGGCACAAGTATCCCCTAGATTATGATCGAAATCTCACAGATACACCTTAACTAATCTAA

GGTCCTATTACTCCATAAACTCATTTTTTGTGTAATTTTGTACAACTTTTGGCTTACGTGACACACTCTGTGACTCCACT

TAAGTGAGGCGCGTGGGAGATGTTTGGAGGTCACGTAGGCCAAAAAAGGTGTACAAAATTACAAAAAAAAAAGTTCAAGG

GTAATAGAACCTCAGTTTAGTTAAGGTGCGTCTCTAAAATTTCGGTCATAGACTATGGTTACTAGTCTCTTATCCCTATT

GAATTTAGGCCAAAAAAAGCAGAAAATTCAATTTTCTTTTTTTTTTTCATTTGTTTTGTACAGCATATGTTGCCAGCATT

TTATATGAGTTGTAGTGAAATGATAAGCAAATGGGAGGATATTGTTTCAAAGGAAACATCATACGAGCTCGATGTATGGC

CAGACCTTCAAATAATGACCAGTGAAGTTATTTCTCGAACCGCATTTGGTAGTAGCTATGAAGAAGGGAGAATAGTGTTT

GAACTTCAGCAAGAACAAGCTGAGCATATAATGGACATAAGTCGTTCAATATATATACCAGGATCGAGGTATGATAATTT

ACTTTTGAGATTTCTACATAATACGGAAACTAAAATGTTCATTACTTAAATTTGTTGTGTTAGGTTCTTGCCTACTAAAA

GGAACAAAAGAATGCTCGAAATCGAAAAGCAAATTCAAACAACGATTAGGCATATCATCGACAAAAGATTGAGGGCAATG

GAAGCAGGGGAGACTAGTAAAGATGATTTATTAGGCATATTACTTGAATCCAATATGAAAGAAATTGAACAACACGGAAA

CAAAGATTTCGGATTGACAACAACAGAAGTGATTGAAGAATGCAAGTTATTCTATTTTGCTGGACAGGAGACCACTTCAG

TGTTGCTCGTGTGGACGATGGTTTTGCTATGCCTACATCCAGAGTGGCAAGTACGGGCCAGAGAGGAGGTTTTACAGGTC

TTCGGAAATGAAAAACCAGATTTGGAAGGACTAAGTCACCTCAAAATTGTAAGTACTTTCCGCTATGTCGTTGGCATAGA

TCAAACTTCAACAATCAAGGAAACTATAAAATCAGGATAAAACAAGTAGCTGTTAATGTGAAATCGTTCCGACTGGGCTC

AGATAGCTAGGCCACTTCTATAATCCTATTTCAGTCTCGGAAGGGCAATTACTATGAGACTAAAATATCTCGCGAAGGCA

TGACCCCTGAATTTTGTAAGAAGTGAACTAATTCTACTTCCAACTTACGCAATGTATTTTTTTTCCATAGGTGACAATGA

TCTTATACGAGACATTAAGGCTATTCCCCCCATTACCGGTATTTAGTAGAAGGAACAAAGAAGAAGTCAAATTAGGGGAG

CTGCAGCTACCAGCTGAAGTGATACTTATTATACCTGCAATCTTTATTCATTATGACAAGGAAATATGGGGCGAAGATGC

GAAGGAATTCAAACCAGAAAGATTCAGTGAAGGAGTGTCAAAGGCAACAAAAGGTCAAGTCTCGTTTATTCCGTTTGGTT

GGGGACCTCGAATTTGCATCGGACAAAACTTTGCAATGATGGAAGCAAAAATGGCAATAGCAATGATACTACAAAAGTTC

TCCTTTGAACTCTCTCCGTCTTATACGCATGCTCCATTTGCAACAATTACTATTCATCCACAGTATGGTGCTCCTCTGCT

TCTGCGCAAACAT

Predicted coding sequence

ATGGAGATTTTGTATAACACAATTATAGCAATAATTTGTGTTGCAATATTGTTGGTATATACATGGAGAGTGTTGAATTG

GGCATGGTTTAGGCCAAAAAAATTGGAGAATTTCTTAAGGCAAAGAGGTCTAAAAGGAAATCCATATAAGTTACTCTATG

GAGATTTGAATGAACTCACAAAAAGTATAGTTGAAGCTAAGTCTAAGTCAATCAATATCTCTGATGATATAACTCAAAGG

CTTATCCCTTTTTTCCTTGACTCCATCAACAAAAATGGTAAAAGTTCTTTCATGTGGCTAGGCCCATATCCAACAGTGTT

GATCACAAATCCTGAACATGTAAAAGAGATTTTGACAAAGAATTATGTGTACCTAAAGCAAACTCATCCAAATCCATTTG

CAAAGTTATTGGCTCAAGGTCTTGTGTTGGTTGAGGAAGACAAATGGGCAAAACACAGAAAAATAATCAATCCTGCTTTC

CATGTTGAGAAGTTAAAGCATATGTTGCCAGCATTTTATATGAGTTGTAGTGAAATGATAAGCAAATGGGAGGATATTGT

TTCAAAGGAAACATCATACGAGCTCGATGTATGGCCAGACCTTCAAATAATGACCAGTGAAGTTATTTCTCGAACCGCAT

TTGGTAGTAGCTATGAAGAAGGGAGAATAGTGTTTGAACTTCAGCAAGAACAAGCTGAGCATATAATGGACATAAGTCGT

TCAATATATATACCAGGATCGAGGTTCTTGCCTACTAAAAGGAACAAAAGAATGCTCGAAATCGAAAAGCAAATTCAAAC

AACGATTAGGCATATCATCGACAAAAGATTGAGGGCAATGGAAGCAGGGGAGACTAGTAAAGATGATTTATTAGGCATAT

TACTTGAATCCAATATGAAAGAAATTGAACAACACGGAAACAAAGATTTCGGATTGACAACAACAGAAGTGATTGAAGAA

TGCAAGTTATTCTATTTTGCTGGACAGGAGACCACTTCAGTGTTGCTCGTGTGGACGATGGTTTTGCTATGCCTACATCC

AGAGTGGCAAGTACGGGCCAGAGAGGAGGTTTTACAGGTCTTCGGAAATGAAAAACCAGATTTGGAAGGACTAAGTCACC

TCAAAATTGTGACAATGATCTTATACGAGACATTAAGGCTATTCCCCCCATTACCGGTATTTAGTAGAAGGAACAAAGAA

GAAGTCAAATTAGGGGAGCTGCAGCTACCAGCTGAAGTGATACTTATTATACCTGCAATCTTTATTCATTATGACAAGGA

AATATGGGGCGAAGATGCGAAGGAATTCAAACCAGAAAGATTCAGTGAAGGAGTGTCAAAGGCAACAAAAGGTCAAGTCT

CGTTTATTCCGTTTGGTTGGGGACCTCGAATTTGCATCGGACAAAACTTTGCAATGATGGAAGCAAAAATGGCAATAGCA

ATGATACTACAAAAGTTCTCCTTTGAACTCTCTCCGTCTTATACGCATGCTCCATTTGCAACAATTACTATTCATCCACA

GTATGGTGCTCCTCTGCTTCTGCGCAAACAT

Predicted protein sequence – 516 amino acids

MEILYNTIIAIICVAILLVYTWRVLNWAWFRPKKLENFLRQRGLKGNPYKLLYGDLNELTKSIVEAKSKSINISDDITQL

IPFFLDSINKNGKSSFMWLGPYPTVLITNPEHVKEILTKNYVYLKQTHPNPFAKLLAQGLVLVEEDKWAKHRKIINPAFH

VEKLKHMLPAFYMSCSEMISKWEDIVSKETSYELDVWPDLQIMTSEVISRTAFGSSYEEGRIVFELQQEQAEHIMDISRS

IYIPGSRFLPTKRNKRMLEIEKQIQTTIRHIIDKRLRAMEAGETSKDDLLGILLESNMKEIEQHGNKDFGLTTTEVIEEC

KLFYFAGQETTSVLLVWTMVLLCLHPEWQVRAREEVLQVFGNEKPDLEGLSHLKIVTMILYETLRLFPPLPVFSRRNKEE

VKLGELQLPAEVILIIPAIFIHYDKEIWGEDAKEFKPERFSEGVSKATKGQVSFIPFGWGPRICIGQNFAMMEAKMAIA

MILQKFSFELSPSYTHAPFATITIHPQYGAPLLLRKH

P023C09 ankyrin protein kinase gene similar to At3g58760. Ten introns predicted downstream of the start codon/upstream of the stop codon. Protein coding sequence shown in bold type. No corresponding SGN unigene.

ATGGAGTCAAAGTCGCAGTCAAGGTTTCCGCTGGGTAGACAATCATCTCTGGCGCCGGAGAAAGACGGCGTTTCCGACGA

CTCAGTTACCGCCGGCCATGGAGTCGATGAAGGTATGGATTCCGGTTTGAGGTTAATGTACATGACTAATGACGGTGATT

TGGAAGGTATGGAGGAACTTTTGGACTCCGGTACCAGTGTGAACTACAGGGATATAGATGGACGGACTGCGTTGCATATT

GCCGCTTGCCAGGGTTACGCTGATGTTGTTGATTTTCTGCTTAAAAATGGCGCTCAGGTGGATTCCATGGATCGTTGGGG

CAGTACGGTATACTTCATTTTTACTCTGTAATTAGATATCACTAACTTGTATATACGTCTAAAAGCTGGTCAAACTAGCA

GCTCAAACGCAGTTTTTGGCTAATGATATTTTGGGAATACTTCCATGCCCTTTCAGCAATCCTGATTCGATAAGTGATTT

ACCAGCATTTTCGTTCCAGTCTAGTATTCAACTTTCCAAACCGTCTTAGACTGTTAGTCATTTGGAAGTGGAATTACAGT

TTTTTTGCTTATATTTAACTCAGGTAATGCCCTATTTTTTGTATAGTTAGGGTGTGTTGGTGCGCAGGAAAATGTGGAAT

TGGGTGCAATGGCCTTGTCTACCTTGTTAAATATTCTTTTGGATAGATTGTGCTCGTTGGTTGAGCTATTAAGAAATGCT

TCTAAGCAAAAATAAGCCAATGTGAAGGTTAATATGACTTGCATGTTATCTTAATAACACCAAAAAAATATTAATTGATG

AAAAATTAGTTTGATATATCACATCAGAGTTTATTTATTTATTTTTAGTTTATTAATATTTGAACTCTTGAAAGCTGTAT

GGGAAAGAGATGTTCCAATTATCTTGGTTTCTAAATGAGAAGAGTGTTTTAACAAATTTAGACAAAGGAGTACGTCTGTT

TCTGGAGAAAATTTATGAATTCTTAATAGTGTTTAATCATTAGTATAGTGATGCTTTGTGAACGGAGTTAGACTCCAAGT

TGTACAGTGATGTCTACAGAGTGGAACATATGTGTGGTTATCTTTGGGTCTATTTTTGGCTTCTCACAGTAATGCAGTGA

AGTGACAAAGTATGATTAAATAGCCTCTTGCAGATGCAATATATTACAAGAATAATGATGTGGTCAAGCTTTTGGAAGTA

CATGGAGCGAAACCTGCGGTATGTCTCGACAACTAGATTGTAGGATCGAAGTGCCCTATGGTAATATGGCATAACCATTT

ACCTTATCTGTTTTACTTTTTACTTTAGGTGGCTCCCATGCATGTAGAAAATGTTCGTGAAATTCCAGAGTATGAAATTG

ATCCAAGAGAACTTGATTTTAGTAATAGTGTAAACATAACAAAGGTAACAACTTATTTCTCTTTGACTTGATAATTATGC

TTATTTGATCATTGCTCACTTTATTCTTTTGTTATTTGTGTTCTGTTATTGCATTAGATGTCTGCTGATTTTTCAGAATG

GGATGCTTGCCTTTGGTAACAAGTATACTGGCATGTTTTTCAAGTTTATTGCCAAGCTCTGTTTCCTCTTTAGTTATCTT

AGTTGATCAACCTGCCACGAATATACAACATATATTTTTGTTTAGGTTTCATTATTTACCCATTCCAAATGTTATTCATC

CATCGCAACATATATGACCTAATTTTGACTAGCTGGGGCATTCAGATGAGAAGGTTTAAAATGATAGTTTGGAAATTTGA

AGACGTGGGATAGCTAGAAGCAAGACGCTAGTTCAACTTTAAGATAACATAAAGTTAAAATTAAAATATATTTACCTTAA

CATTTTGAAGAGGGAAAGTATTTGTGAGGTAGGCTACAGGTAAGTAGATCAAGAATTTGGGGTTGAATGAAGTATCTGCT

GTTATTATTGTATTTGTTTCTGGCAACTGTTTGCTTTAATCCTACCTGTTATTTCTAACTTCTTGTCTGTTGCTATGTAT

CTGGGATAAAAGTAGATGAACTTTCAATACTGCAATATATTTTCATATCATATTAAATGATTGTAGGGTACGTATTGTGT

TGCTCTGTGGCGTGGAACTAAGGTTGCTGTTAAGAAACTTGGTGAAGAATTATTCACCGACGAAGATAAAGTGTGGGTTG

GTCATAGACTATCTGTGATGTTAGAATTTGAACATTCCTCATTTGACAATTCATAAAAAATTACTAAAGACGCTTCTCTT

TGTTTTCTAACTGTTTTTCAGCAAGGCATTTGGGGATGAGCTTGCCTTAGTACAGAAGATACGCCACCCAAATGTAGTCC

AGTTTCTTGGTGCTGTGACACAGAGTAGCCCAATGATGATCGTCACAGAGTATCTGTCTAAGGTACTTCTGATTTAAAAG

AACAACTCACCACTTCCTGGAGTTATCTCCAGAACTTTGCTATGATGTCACAAAATCAAGGACTTATTGTAATTTGAAAT

TATCACAACGTCGAAATCAAGAACGACCATGCATCAAAATAGTATAATTGATGGTTAAGTATCAACAAAGTACTCAATAC

AAGGGCGTTAACGACTTCACAAATCACGCATATTATTTCATCATTGAAGACATGGTTCTGTTTTGTTTGTTGATCAAACG

AAATATTCCCCATTATTTATGTCAATTAAATTCATTAAAGTCGTTGAGAAAGCCTTTGAAGTCCCTGCAGATTTAAAGTA

TACCATTGATTCTGTTCTTATTCAGGGAGATCTTCGTGCATTCTTGAAACGGAAAGGTGCATTAAAGCCAATAATGGCTG

TGAAGTTTGCACTGGATATTGCAAGGTCAGTTACTGGCTGATTTCCTCAAATTTTCACTTGAGAATCTTATTAGTTTTGC

ATGCATGCTGTTCACCTGGTGCTTGAATTTGCCTAAGGTGTCTGTTGATAAGTGGCCCATTACTACAGGAACACCAACTA

CAGTCTCTTCAATTCTATGTACAATTTAGAATTGTAACATTTATTTTGTACCTCTTCATGCATTTGTGTTTTTTCACCAT

TGGGTTATAAATTTTTCAACTTTGTTGATCTCAACAAAGTACTGTGCTGGACTTTGGGGTTCCATAATGATTATATCTTC

ATAGAAAGCATAGTAGTTGCGCAGCTTCATGATCAGTTGCAGAAGAAGCTGTGTACATAAATATGTTGAGAAACCTGAAT

TTATCTTTCTTATAGTTGCGCCTTTATGTCTCATATGGTCATATTTGTATACATTTTGCAGAGGAATAAACTACTTGCAT

GAGAATAAACCTGAAGCAATAATTCATCGAGACCTGGAGCCTGAGTATGTTATTATAGTCTTCCTGACTGTTTACCCGTG

GCCAGTCTCGTGCTTTGTTTGTTCTTTAGTGGCTGAAGCCTGACAAATGTATGGAAAACTTTTAATTTCTGAGTGAAATG

ACAGAAACATATTACGGGATGATTCTGGACTTCTGAAAGTTGCAGATTTTGGACTTAGTAAGCTGATGAAATTTACCAAA

ACTGTCAGGGAAGTTAGACCATTGGCGCGTCAAGAGGATTCATGTGAGTGTATCCCAGCATTTTCCGCGGTTGAAGAAAT

ATATTCACTCTAATGATTTGTTGCTGTTACTTTGTTGTCACTTTTTTGTTACTCTTATATTTATGCAAAGCGTATACGAA

CAATGGCTTTAAGCTCAAGTCTCATGGTTCTACTTTTCCTTTTAATTTTGATGAAGCAAATTTTCACCTCTGTTTCGGTG

TTTCCTTTCTAAGCTTCAGCATATGGTCGTTGAATTTTTTATTTGAAACTGAAAGTGACAAAGTGTTTGTATGGTCCTTG

AATTTTTTTGCCAGCAAATACTAAACCGTTCACGTTTTGACACTTAAATGGTTGTGCTAGTGAATGAAACTCTAGGATTT

GGGATAGGAGTATCTTGATTTTTTTTTGTTCATCAAAAGAACTATTCTCTTGAACATTTGGCAATAGAGTTTGAAGAGGA

GAACTAGAAAGTTATTTTAGAAAAAGAATATGCATAAGTACTGGTTGCCTCAAATTTTAGTTGATAGCACTCCTATTTAA

TCATTGTAGAATTATGGGTCTTTATACGCATGTTTTTAACAAGGAAATTGGTGTGATATTACGTTTTAGTATATGAGAAT

AACAAGTTGAATTGACCTCTTGGTTTACAGGGAGATATGTTGCTCCAGAAGTTCTTAAGCATGAGGAGTATGATACCAAG

GTGGATGTTTTCTCATTTGCTTTGATATTGCAAGAGGTAAGCTCTTCTAATTCTTAAAACTTTTCTCTCATGCATAAGCT

ACTTAAAAAGGATCTCCAGTTGTGCCTGTCTGGAAGAAAAAATGTTAGTTATCACTTCTTGCTTCGTAGATATTTTAAGT

TTTTTACTTTATTTAACTGAACTTTGAGTGTAATGCGTGCTAATGGGCATGATATCAGATTGATAGCCACCAATAGGTTG

GTATGTATGCATTCTAGAGGTCATCTCATGGAGTAAAAAGGCAACGGGGTCCTCCATATTTTGCAGTCGATGTTAGTTGT

TTCTAAAAAGATTGCATTGCCATCTACTGTCTCCTATTCTTATTTCTTGCAAATTTATGCTTATTCTACCTTATTAATTC

ACTCGGAACACCTTGACTGTTCCAGCATGTTTGTAAATCCCTTATTATTTAAGAGGGCCGTCGGGTAATTTAAATATGTA

TACACCTTAATATGCTTTCCGTTCCACAGATGATTGAAGGCTGTCCACCATTTTCCACGAAGCAGGAAATTGAGGTGGCC

AAAGCATATGTTGCAAATGAACGCCCTCCCTTTAAAGCTTCACAAAAGTTATATGCTCATGGATTGAGAAAGTAAGTCCC

TGTGCTTTTTTCGGTTCCCTTTAATAGTATTTAAAGTGATTATTTCAACAGGTTAATTGAGGATTGCTGGAAGGAGCAAC

CATCAAAAAGACCGACTTTTCAGCGAATAATTATCAGGTTGGAAGAAATTAACCGTATTCTTTTGCATAGAAGACGTTGG

AAGGTACAAATCTCTCTCTCCCGACTCCCTTCAGTTCGGTATTTCCAAAGTCTGGTCATATATAATAAATCAAGCTTCGG

TATGGTAAATTCTGCTTCAGTAATTCGG

Predicted coding sequence

ATGGAGTCAAAGTCGCAGTCAAGGTTTCCGCTGGGTAGACAATCATCTCTGGCGCCGGAGAAAGACGGCGTTTCCGACGA

CTCAGTTACCGCCGGCCATGGAGTCGATGAAGGTATGGATTCCGGTTTGAGGTTAATGTACATGACTAATGACGGTGATT

TGGAAGGTATGGAGGAACTTTTGGACTCCGGTACCAGTGTGAACTACAGGGATATAGATGGACGGACTGCGTTGCATATT

GCCGCTTGCCAGGGTTACGCTGATGTTGTTGATTTTCTGCTTAAAAATGGCGCTCAGGTGGATTCCATGGATCGTTGGGG

CAGTACGCCTCTTGCAGATGCAATATATTACAAGAATAATGATGTGGTCAAGCTTTTGGAAGTACATGGAGCGAAACCTG

CGGTGGCTCCCATGCATGTAGAAAATGTTCGTGAAATTCCAGAGTATGAAATTGATCCAAGAGAACTTGATTTTAGTAAT

AGTGTAAACATAACAAAGGGTACGTATTGTGTTGCTCTGTGGCGTGGAACTAAGGTTGCTGTTAAGAAACTTGGTGAAGA

ATTATTCACCGACGAAGATAAAGTGTGGGCATTTGGGGATGAGCTTGCCTTAGTACAGAAGATACGCCACCCAAATGTAG

TCCAGTTTCTTGGTGCTGTGACACAGAGTAGCCCAATGATGATCGTCACAGAGTATCTGTCTAAGGGAGATCTTCGTGCA

TTCTTGAAACGGAAAGGTGCATTAAAGCCAATAATGGCTGTGAAGTTTGCACTGGATATTGCAAGAGGAATAAACTACTT

GCATGAGAATAAACCTGAAGCAATAATTCATCGAGACCTGGAGCCTGAAAACATATTACGGGATGATTCTGGACTTCTGA

AAGTTGCAGATTTTGGACTTAGTAAGCTGATGAAATTTACCAAAACTGTCAGGGAAGTTAGACCATTGGCGCGTCAAGAG

GATTCATGGAGATATGTTGCTCCAGAAGTTCTTAAGCATGAGGAGTATGATACCAAGGTGGATGTTTTCTCATTTGCTTT

GATATTGCAAGAGATGATTGAAGGCTGTCCACCATTTTCCACGAAGCAGGAAATTGAGGTGGCCAAAGCATATGTTGCAA

ATGAACGCCCTCCCTTTAAAGCTTCACAAAAGTTATATGCTCATGGATTGAGAAAGTTAATTGAGGATTGCTGGAAGGAG

CAACCATCAAAAAGACCGACTTTTCAGCGAATAATTATCAGGTTGGAAGAAATTAACCGTATTCTTTTGCATAGAAGACG

TTGGAAGGTACAAATCTCTCTCTCCCGACTCCCTTCAGTTCGGTATTTCCAAAGTCTGGTCATATATAATAAATCAAGCT

TCGGTATGGTAAATTCTGCTTCAGTAATTCGG

Predicted protein sequence – 464 amino acids

MESKSQSRFPLGRQSSLAPEKDGVSDDSVTAGHGVDEGMDSGLRLMYMTNDGDLEGMEELLDSGTSVNYRDIDGRTALHI

AACQGYADVVDFLLKNGAQVDSMDRWGSTPLADAIYYKNNDVVKLLEVHGAKPAVAPMHVENVREIPEYEIDPRELDFSN

SVNITKGTYCVALWRGTKVAVKKLGEELFTDEDKVWAFGDELALVQKIRHPNVVQFLGAVTQSSPMMIVTEYLSKGDLRA

FLKRKGALKPIMAVKFALDIARGINYLHENKPEAIIHRDLEPENILRDDSGLLKVADFGLSKLMKFTKTVREVRPLARQE

DSWRYVAPEVLKHEEYDTKVDVFSFALILQEMIEGCPPFSTKQEIEVAKAYVANERPPFKASQKLYAHGLRKLIEDCWKE

QPSKRPTFQRIIIRLEEINRILLHRRRWKVQISLSRLPSVRYFQSLVIYNKSSFGMVNSASVIR