Supplementary Table 1.

List of genomic sequences, predicted coding sequences and predicted protein sequences for genes carried on BAC clones P049P16, P166A09 and P023C09 anchored to the I-3 region of tomato chromosome 7.

P049P16 strictosidine synthase gene 1 proximal to SP6 end of BAC and corresponding to marker bP16. Similar to At1g08470, At2g41290, At2g41300, At3g57010, At3g57020 and At3g57030. Gene lacks introns.

ATGAATGATTCAAATATACTATTGTTGTTCATTGCTACTGTAGCGTTATTTTCCTCAGTTAATTTAGCCTTTGATGATTC

GGAAAATGCGTTGAAATCCCAAAATGTACTCTCAAAATCCGAAATCATCCAACTTAATGGAGCAATTGGACCAGAGAGTG

TTGCTTTCGATCCAAATGGTGAAGGCCCATACATAGGCGTAGCCGATGGACGAATACTCAAGTTTCAAGGATCACATTGG

GCTGATTTTGCAGTCACTTCTTCTCAAAGGGAGAGTTGTACACTGCCTTTTGCACCAGAAATGGAGCATATATGTGGGAG

GCCATTAGGTTTACGATTCGATACAAAAACAGGGGAACTCTACATTGCTGATGCGTATTTCGGGCTCCAAGTTGTTGGAC

CAAAAGGAGGATTAGCTACACCGTTAATCCAAATATTAGAAGGTGAGCCTTCTTATCTTCCAAACGACGTTGATATTGAT

GATCAAGACGATGTGATTTACTTCACCGACACAAGCACAAGGTACCAACGCAGACAATTTGTCGACTCTCTTTTAAGCAG

AGACGCGACTGGCAGGCTAATGAAATATACTAAATCAACCAAAACAACTGAAATACTAATAAGAGGCCTTGCTTTTGCGA

ACGGTGTATCTTTGAGCAAAGACCGATCATTCGTACTAGTAGCTGAAACTTCTAATTTTAGAATTTTGAGGTACTGGCTT

AAAGGCCCTCTTGAGGGAACACATGATACATTTGCTGAGTTGCCAGGGTTTCCGGACAACATTAGAATGAACTCGAAAGG

GGAATTTTGGGTAGCTATACAAGCAATAAGATCACAATCGAGTTTTTCAAATTCGGAAATGGGAAATGAATTGTTGAAGC

TCCGATTCATCGCGCAAAAATTTAACAATTTGTTACGTGGAGGGCTGCTGCACGCTACAGCAATCAAGCTAAGCGAGGAC

GGGCGAGTTTTGGAGGTTCTAGAAGATGTTGAAGGCAAGACGTTGAGGTCTATAAGTGAAGTTCATGAGATATATGACAA

GTTGATGTTTGGTTCTGTTATAATGCCTTTTTTGGGAGTTTATGAATTA

Predicted protein - 363 amino acids

MNDSNILLLFIATVALFSSVNLAFDDSENALKSQNVLSKSEIIQLNGAIGPESVAFDPNGEGPYIGVADGRILKFQGSHW

ADFAVTSSQRESCTLPFAPEMEHICGRPLGLRFDTKTGELYIADAYFGLQVVGPKGGLATPLIQILEGEPSYLPNDVDID

DQDDVIYFTDTSTRYQRRQFVDSLLSRDATGRLMKYTKSTKTTEILIRGLAFANGVSLSKDRSFVLVAETSNFRILRYWL

KGPLEGTHDTFAELPGFPDNIRMNSKGEFWVAIQAIRSQSSFSNSEMGNELLKLRFIAQKFNNLLRGGLLHATAIKLSED

GRVLEVLEDVEGKTLRSISEVHEIYDKLMFGSVIMPFLGVYEL

P049P16 strictosidine synthase gene 2 distal to SP6 end of BAC relative to gene 1 and corresponding to SGN-U323940. Similar to At1g08470, At2g41290, At2g41300, At3g57010, At3g57020 and At3g57030. Gene lacks introns.

ATGAATGCTTCAAATATACTATTGTTGATTATCGTTGTACAACTTGTTTCAGTAAATTTAGCCTTTGAGAAAACTCAAAA

CGTTCTCTCAAAATCGAAAATTATCCATCTTAATGGGTCGATTGGACCGGAGAGTGTTGCGTTCGATCCAAATGGCGAAG

GTCCATACATAGGAGTAGCCGATGGACGCATTCTCAAGTTGCAATTAGGGTCAAATAATCGATTATTTTGGGCTGAATTC

GCGGTCACTTCTTCTCATCGAAGGGATTGTACCTCACCATTCGCTCCTAAAATGGAACATATATGTGGTAGGCCATTAGG

CTTACGATTCGATACAAAAACAGGTGAATTATACATTGCAGACGCGTATTTAGGTCTACAAGTTGTTGGACCCAAAGGTG

GACTAGCAACTCCATTAGTTCAAAAATTCGAAGGTAAACCTCTTGTTTTCACAAATGACGTTGACATTGACGATGATGTG

ATTTATTTCACGGATACAAGCACCAAGTATCAACGCTGGCAGTTTCTAACGTCGTTTTCAAGTGGTGATACGACTGGTAG

GTTGATGAAATATGATAAATCTACGAAAAAAGTAACAGTCTTATTAGGTGATCTTGCTTTTGCAAATGGCGTTGCGTTGA

GTAAAAACAAATCGTTTGTTTTAGTGACTGAAACTACAAATTTTAGAATTTTAAGGTATTGGCTTAAAGGCCCCTTAGTA

GGAACACATGATGTATTTGTTGAGTTGCCCGGGTTCCCGGACAACATCAGAATAAACCCTAAAGGGGACTTTTGGGTCGC

GTTACAAGCAATAAGATCAGTACCCAGTGTTTCAGATTCGAAATTTGGAATGTTTAGTTTCAACCCTCAGCAAATGGGAG

ATGACGGGGAGCTACACCCTACCGCCCTCAAGCTAAGTGAGGACGGGCAAGTTTTGGAAGTTCTAGAAGATGTTGAAGGC

AAGACATTAAGGTCTATAAGTGAAATTGAAGAAAAAGATGGGAAGTTATGGATTGGTTCTGTTGTGATGCCTTTTTTGCG

AGTTTATGAAATG

Predicted - 351 amino acids

MNASNILLLIIVVQLVSVNLAFEKTQNVLSKSKIIHLNGSIGPESVAFDPNGEGPYIGVADGRILKLQLGSNNRLFWAEF

AVTSSHRRDCTSPFAPKMEHICGRPLGLRFDTKTGELYIADAYLGLQVVGPKGGLATPLVQKFEGKPLVFTNDVDIDDDV

IYFTDTSTKYQRWQFLTSFSSGDTTGRLMKYDKSTKKVTVLLGDLAFANGVALSKNKSFVLVTETTNFRILRYWLKGPLV

GTHDVFVELPGFPDNIRINPKGDFWVALQAIRSVPSVSDSKFGMFSFNPQQMGDDGELHPTALKLSEDGQVLEVLEDVEG

KTLRSISEIEEKDGKLWIGSVVMPFLRVYEM

P049P16 gene similar to At2g30900. Four introns predicted downstream of the start codon/upstream of the stop codon. Protein coding sequence shown in bold type.

ATGAAAAATTCTCTAATAATTTTTCATAATTGCTTCTTCAAATTACTAGTAATTATAATCAACATTATTTTGTTCATCAA

TAATAATGTTGATTTTCTAGTAGAAGCAAAACAAAACAAGCTACTACATCCTCCCTTCAAAAAAAAGGGTGCAAATTGTG

ATTTATATGATGGAAAATGGGTTATTGATTATAATTATCCACTTTATAATGCAAAAAATTGTCCATTTTTACTTCAACAA

TTTGATTGTGTAAAGAATGGTAGACCAGATAAAGCATATCTCAAGTATAGATGGCAACCCACAGATTGTAACTTAGCCAG

GTAATGAATTACATCTATCTATCTTTTTTATCGTGTTTTTCTTGCTGTCTTTCGAAAACGTCTATTTACCTCTATGAAGT

AATGGTTAAATCTATATATGTTTTATCTTTTTTGTATGGTACTTAATGAAATAATACTGAATATGTTAGTATTATTCGTA

TAAATAATAGATAAAAAAATAAATAGATAGAGAAATTTTGAACGAATTGTTTCATCTTGTATGTATCGAAAGTTGATTGA

TGACAAGTGGCTGATAAAAGTTACTTATATTTAAAAAGCCAATGCTTATGGTGAGGGTCGAGGCGGAGAAATTAGAAATT

TCGTTAAAGAAAGTTTTAAGAATTAATATATACATAATTTTATATATATATATATATATATATATATATATATATATATA

TAATATATTTTTTTAACGAAAGATGATTAACTAACATTCTTTCGTTGTATATGGCTGAGTCACTAAACGAAGACCATATT

TTATTGTGACATTTGAAAAATATGATTTTTACTTTAAAAATCGAAAATGATACTGAAAATGAAAGTTATGCATAATTACG

GATACAAATTAGAGTTGTTTTTTTAAATTTTTTTTATGAGAGAAAAAAGTGAAAAATACTTTTTGTTATTTTCTAAAACT

CTATTTTTTACATTCTAGTTGAATTCCATATGCTTATTGTCAAATGTGCTTTCCCAAGTTCAACTTTAGAGAAGAAAAAA

ATTGAAACAATTTCATAGACAAACAAATATTCGATTTCTCACTTTATAATATTCTTTTCGTTTAAAAAAAAAAATATTCT

CCCCAATTCTTTAATCTCCTATCTAATATTTTTTTAAATAAATATAAAACAGATGAAAAAACTTGTCTCATCTATATCGT

GCTTCGTAAATATTCGATTATCTAGGTGAACATGTTTTGCTTGATAATTGAATTATTTGTTTTCGCGCATTCTGTTTTTT

GCCATTTACGTTGTTGAGTCCTCTCTACAAACCAAAATGTTACTTTCTACTTATCGTCTCAACTTATATCATAATTCAAA

ATTTATCGTGACTTATAATATTTTTATGTAATTTTAAATATATAAATTATTTTTTAATTTCTTAAAAATTATATGACCAA

ATGAATGGTCAAAATGAAAATTAGTAATTTAAATGATATCATACAAATTGAAATGAAAAAAATAATTAAGATTTCTTGAT

GAATTACTAATCAATTAAGGAATTTTTCTAATAGTAAATAATTTCACGAGATCACGAATTGATGCAATTAATATCCAAAA

TAGGTGGGAATACTGCATTTGTAGATTAGTAATTTATGAAGAAAATAATTAAGATTCCTTGATAAATTACTAATCTACAA

ATAAAATATTCTCGCCTATGTTAAATATTAATTGCATCAATTTGTAACCTTGTGAAATTATTTATTGTTAGAAATTTAAG

GCATTTATGATATAAACTTGTTTTTCACGTGTTATACAACTTGTAACTAACAATAGACAAATTTTATATATATATATATA

TATATATATATATATATATATGTTAATAGTGTTTTATTTGTAAAGTTTTTATCAAAAAATATTTTAGAAAATAAAAAATC

AAGTCTTTCAAACTAACTAGTTTTTTGTGGGATGAATGGTAGAATGATCAATATTTTTCCTTTAAATTTTATGTTGACTA

TTATGTATTTTTGTAAGTATTCACCGAAGTATGTGATTCATAAATATATTTTTGTAAGGTATTCACCGAAGTGTCTGATT

CATAAATATATTTAGTAAGTATTTCTACGTATTAATGTCGTGTTCATAGACGTCAACGTTTGATACTCTTAGATACTCTT

TCTAAGGGAGTAACATTGTTATTTTTTGGTTGAAGGGCCAACTCGTGGCCCACTCAGGTCTGGACTGAGCTGCTATTTTA

TAGGCCCTTTAATTAAAGGATTAATGACAAAAATCCCACATTTAAGTTCTCTTATTACCATTATCCTCTATTAATTTACA

ATTTCCCAAAATTCCTCATTTTCATGCATCAGATCAATGTATCAGTGTATCAAATTAATGTATCTCTCGCATCAAATTAG

TGTATCATGTATAAAATGTATATCATATTAGTGTATCATGTATAAAATGTAATGTATCTTACTTAATGATTAATGTATCT

CGCTCATCAGATTAATGTATCAACGCTCATATTATTGTATCAGTTGGAGGGATTTTTGTAATTATAAACTTATAAGCGAC

AAATGGTAATGTTACCTTAAAAGTATGTGATTTCTGTCATTTGCCCTTAATTTTGATTAAAAGGGTCAGCCCATCCAACG

CGTTTAACTCTGTAGCCCGTTAGGGTTGGATCGGATACTCAGCCTATTTTAATAGCTCTAATGATTATAAATATTTTCAA

ACGAGTGACCAAACACATAACTATTTCCCTCTTTATTTTGTTATGTCTTTCCATGAAACATTAGTAAAAATACTTTCTTA

ATATTTGTGTACTGTCTAACGACTATAAATATTTTCGACAAGTGATCATTTACGTAACTATTTCCCTCTTTATTTTGTTA

TATGTCTTTCCATGATATGTATACTGACTAACGACTATAAATATTTTCTGCGAACGACCAAATACGTAACTATTTCCCTC

TTTATTTTTTTCTTATATATGTCTATCCATGTAAAAATAGTTTTTAAATTCTTGAGTTTAATTTTTGTATATACACATAT

AGGTGGGATGGAAGTGACTTCATGAGAAGAATTAAAAACAAGAAGGTATTATTCGTGGGAGATTCATTGAGCTTGAATCA

ATGGCAATCTTTGGCTTGCATGCTTCATTCTGCCTTTCCAAGTCTTAATTACTCTGTCACCAGAAATGGACCACTCATGT

CAACCTTTTCTATACCCGTAAGTGAATCGAGGTGAATTCAGAATTTAAATTTAATGAATTCGTATGATTTGTGAAGGGTA

TATTATGCATCTTCGTTGTTTTTATTTTTTAAAATTTGAATTTGATGCACTTAAATCGAATATCTATTGAAAATAGGAGG

CAGTAATAACTGATAATGTACAAATATACTTTACCTTTCTAAATCTCATCTAGTGACATTTTGCTGAATACGTTATTGTT

AATATATAGTATAATTATTTCTTTAATTCATTTTTATTTGTGCGTATTGATTTGAGATAGCTCTCAAGGTGCAATATATT

GAATATATATAGTAGACTCAATATTTTGACAAATGATGATAGTTATTAATAAATGATAAATTAACTAGAAATAAGTGATA

TAAATTATTACAAACTTAACCTCTAATATGGGTAATTAAAAGGGTTGACACATAATAATTGGATAAATTGTGAAGATTTC

TTCTTTTTTTAAAAAAATAAAAAAAATAAAAAATTTCCCATGTTTTTGGGGGGAATTGCATTTATGAGAGAAAGGGACTT

GACCTTACCTCATAAAGCACAACACAAGATAAAAATTGTGAATATTAATTGGGGGAGTTGTATTAAGTTATTGAAATAAT

AATTTTGTAACACTTTAGAATTTTTTATTATTTATATTATTAGGTTATCAGTTTGGAAGTATAGAGAAATAAAAAATATA

TATTTCAATTAATCAAATGTAATTATGTATCATACGGATCAACATCGATATTTATTTATATTTCAAGAATTGATAATATA

AAATCTCAAGATATACACACATAACTGATCAGGACCAAAAATACTAGATTCAACTGAACTTATTAACTAAAACTAATTTA

TCTATCCTCTTTTATGCTTAATTTCTCACATTTGTCTTTCAATATAATATTGTTAATGTCAAATTGATAATAATCTCTCT

AATAATGTTTTTTTTAAAGAAATTACATTGTTGAATTTATGTAGTCAAAGCAAGTGAGATTGAGTTATGTGAGAAATGCA

TTGCTAGTAGACATAGTGAAGGAGAAATCAAAAAGAGTATTAAAGTTGGACTCAGTTGCAATTTCTTCAAAGCTGTGGAC

TGGTTATGACATTTTGATATTTGATACTTGGCATTGGTGGATTCATACGGGAAGAAAACAACCGTAAGTTTTAATTTTTA

TGAAAAAATATTAGAGATTTTGATGTCTAAATTGAGAACAACATATTATCGTGAGAGTGTCGAGAAGGTAGAATGTATGT

AGAGAAAATTGATGGACATGGTGGGTCTAAATATAGGGAGAAAATCGTTTTTGTTTGACAAATATTTTTTTAAAATTGAA

ACCGATGGATGTATGTCATAATTCATATCGAAATTTATATGATTGACCTCCTGATGGTCTTTCAGAAACAATATATTTGC

CTGTACGAGGTAATGATAAGCTCATCATAAACTCTATCCTTTTTAGACCCTTACTTAGTTCAATTTCACTGTTTATGTTA

TTGTTGTAGACCCTAGTTTATATTCTGTACAAAATAAATATCAACTAAATTGACACTAATTTTACAGATGGGATTTGATT

CGCGATGGGAAAATCCTACGTCGAGATATGGATCGTTTAAAAGCTTATGAAAAAGCCTTAATAACATGGGGTAAATGGAT

TTCCAACAACATTAATTTCAAGAAAACTAAGGTCTTTTTTCAAGGCATCTCACCTGATCATAGCAAGTAAGATTTCAAAT

ATTTCAAACTTTCGTGTCTGATCAAATAATGTCATATGAATTAACATTTTATTTTTTTACAGTGGCACTCAATGGGGTAA

AAAATCCAACCAAATGCAATGCAAAGGTGAACAAAATCCAGTAAAAAAACTGAGTTACTCAGGAGGTGAAGATGAAGCAG

ATATATTATTGGGGAAAATATTGAGCAAAACAAAAAAGCCAATACATATGTTGAAACTCAACAAAATGTCACAATATAGA

GTTGATGGTCATCCTTCTATTTATGGTAACCCTAGATATAAAGGAATGGATTGTACACATTGGTGTTTACCTGGTGTACC

TGATATTTGGAATCAACTTCTTTATGCTAATCTCATT

Predicted coding sequence

ATGAAAAATTCTCTAATAATTTTTCATAATTGCTTCTTCAAATTACTAGTAATTATAATCAACATTATTTTGTTCATCAA

TAATAATGTTGATTTTCTAGTAGAAGCAAAACAAAACAAGCTACTACATCCTCCCTTCAAAAAAAAGGGTGCAAATTGTG

ATTTATATGATGGAAAATGGGTTATTGATTATAATTATCCACTTTATAATGCAAAAAATTGTCCATTTTTACTTCAACAA

TTTGATTGTGTAAAGAATGGTAGACCAGATAAAGCATATCTCAAGTATAGATGGCAACCCACAGATTGTAACTTAGCCAG

GTGGGATGGAAGTGACTTCATGAGAAGAATTAAAAACAAGAAGGTATTATTCGTGGGAGATTCATTGAGCTTGAATCAAT

GGCAATCTTTGGCTTGCATGCTTCATTCTGCCTTTCCAAGTCTTAATTACTCTGTCACCAGAAATGGACCACTCATGTCA

ACCTTTTCTATACCCGTAAGTGAATCGAGATTGAGTTATGTGAGAAATGCATTGCTAGTAGACATAGTGAAGGAGAAATC

AAAAAGAGTATTAAAGTTGGACTCAGTTGCAATTTCTTCAAAGCTGTGGACTGGTTATGACATTTTGATATTTGATACTT

GGCATTGGTGGATTCATACGGGAAGAAAACAACCATGGGATTTGATTCGCGATGGGAAAATCCTACGTCGAGATATGGAT

CGTTTAAAAGCTTATGAAAAAGCCTTAATAACATGGGGTAAATGGATTTCCAACAACATTAATTTCAAGAAAACTAAGGT

CTTTTTTCAAGGCATCTCACCTGATCATAGCAATGGCACTCAATGGGGTAAAAAATCCAACCAAATGCAATGCAAAGGTG

AACAAAATCCAGTAAAAAAACTGAGTTACTCAGGAGGTGAAGATGAAGCAGATATATTATTGGGGAAAATATTGAGCAAA

ACAAAAAAGCCAATACATATGTTGAAACTCAACAAAATGTCACAATATAGAGTTGATGGTCATCCTTCTATTTATGGTAA

CCCTAGATATAAAGGAATGGATTGTACACATTGGTGTTTACCTGGTGTACCTGATATTTGGAATCAACTTCTTTATGCTA

ATCTCATT

Predicted protein sequence – 376 amino acids

MKNSLIIFHNCFFKLLVIIINIILFINNNVDFLVEAKQNKLLHPPFKKKGANCDLYDGKWVIDYNYPLYNAKNCPFLLQQ

FDCVKNGRPDKAYLKYRWQPTDCNLARWDGSDFMRRIKNKKVLFVGDSLSLNQWQSLACMLHSAFPSLNYSVTRNGPLMS

TFSIPVSESRLSYVRNALLVDIVKEKSKRVLKLDSVAISSKLWTGYDILIFDTWHWWIHTGRKQPWDLIRDGKILRRDMD

RLKAYEKALITWGKWISNNINFKKTKVFFQGISPDHSNGTQWGKKSNQMQCKGEQNPVKKLSYSGGEDEADILLGKILSK

TKKPIHMLKLNKMSQYRVDGHPSIYGNPRYKGMDCTHWCLPGVPDIWNQLLYANLI

P049P16 heat shock protein gene based on segments of chimeric unigenes U314912 and U314913 and P049P16 sequence corresponding to At1g06460. Five introns predicted downstream of the start codon/upstream of the stop codon. Protein coding sequence shown in bold type.

ATGGAGAGTCAAATTGTTCGACGAAGAGTTAACATGATTACTGCTCATTTAACTGCACATGATGATATTTCCGCCTCCGC

TACTCATCTCTTTCCTATGGTAATCTCTTTCTCTGTCTCTACTCATAGTAATGTTAGCAGGGACGGAGTTACAGGTTCGA

TAGAACTAGTAGCTTTCGCCAGCATTTCGTATTTATGTTTAAAAAATTATGAATAGTATAATTTATTTGAAGTAAAGTCA

AAGGTGTCTTTACGAGAATCCAGAACCTCTGAATGGTAGGACTTGTCACGAGCTAATTTGAAAATAAAGTAATCTACTCA

TAGCCCTTTGGTTAAAGTCATACCACTATTCATTTCCCCTGTTTCTTTTAACTATATATCTATTGATGTGCTTCTATTTG

ATTTTTCACTTTGTTTACTGTATAGAGCTGTAGCAGTAGCTTGAATTCTGCTATTCCGAGGAGGTACGATAACAGAATGA

ACTATGCAAGACAAAGTTCCAGTTCTCAAGCTTGTTTCATGAGGACAAGTGAACAGGTCTGGGAATTATTACTAATATAA

TTGACATTACTTTAGTTTCAATGAGTTTGTAATATTCGTTCTGCAGGTGTTAGCTTTTTTCATTTTTTTTTCTTGCTTTG

GGAGCAGGGAAGCTGTACTGAATCCACTGCGGCTTTCAAGGCTAGTGATTATGCAAAGAAGAGTTCTCGCGCCTTTGAAG

GACCAATGTTTTCTAGACCTGCAAATAATTGCAAACACAATGGAACTGTTGAAGAAGCTCCTAAATTTGCTAGGCCTCGT

TTCCAATTGAAAGAAAGAAGAAATGAACTTGAATCTAATGGTAAACAAACCTATGCTTTACTTTTGATTGTTATATCGCG

TAATTGAGAGGTACGTCCTCTTTGGAATGTTGAAACATTTCCTTTTGTTTTTGCTAATGCAGGGAGTGAATGGTCTCCTA

AGATGGATGTTGCAGAATCTGGAAGCATGTACGTCGTATCTATAGAACTTCCCGGTGTCAATATAAATGATATAAAGGTC

GAAGTCAGCCACAAAAGGTAAATAAATGACAACTATCCATTAGTCTTTCTTTGATTTCTCGTATAGTCACTATTATCTCA

GAATGTCAATTTCTTTGTGAGATCAGCATGTGTTATAAAGTTCCATCTTCTGCAAAGATGAATTCAATTTGCGTTGATCT

AATAGACGCGTGTTATGTTCCTTGACAGCTTAATAGTTTCTGGAAATCGTTCCACTCAGTGTAAAGTGGCATCATACTTG

AATGGCTTGGTATCAGCCTATCATAAAAAGGAGATTGTTCAGGGACCATACCGTGTTTTCTGGCCTCTTCCAAGTAATGC

TAATAAAAATCGCGTCTCAGCTGAGTTTGTGTAAGTTATCAATATTTGTGATTGTTTACCTATATATCGCCATGCTTAAT

GTTTTTAGTCGAGAAAAAACACTTCGTTACATATAGACTTGTGAAATTTCATGACTCTAAAACAATGCAGGGACGGACTT

TTACAGATTACAATCCCGAAACTT

Predicted coding sequence

ATGGAGAGTCAAATTGTTCGACGAAGAGTTAACATGATTACTGCTCATTTAACTGCACATGATGATATTTCCGCCTCCGC

TACTCATCTCTTTCCTATGAGCTGTAGCAGTAGCTTGAATTCTGCTATTCCGAGGAGGTACGATAACAGAATGAACTATG

CAAGACAAAGTTCCAGTTCTCAAGCTTGTTTCATGAGGACAAGTGAACAGGAGCAGGGAAGCTGTACTGAATCCACTGCG

GCTTTCAAGGCTAGTGATTATGCAAAGAAGAGTTCTCGCGCCTTTGAAGGACCAATGTTTTCTAGACCTGCAAATAATTG

CAAACACAATGGAACTGTTGAAGAAGCTCCTAAATTTGCTAGGCCTCGTTTCCAATTGAAAGAAAGAAGAAATGAACTTG

AATCTAATGGGAGTGAATGGTCTCCTAAGATGGATGTTGCAGAATCTGGAAGCATGTACGTCGTATCTATAGAACTTCCC

GGTGTCAATATAAATGATATAAAGGTCGAAGTCAGCCACAAAAGCTTAATAGTTTCTGGAAATCGTTCCACTCAGTGTAA

AGTGGCATCATACTTGAATGGCTTGGTATCAGCCTATCATAAAAAGGAGATTGTTCAGGGACCATACCGTGTTTTCTGGC

CTCTTCCAAGTAATGCTAATAAAAATCGCGTCTCAGCTGAGTTTGTGGACGGACTTTTACAGATTACAATCCCGAAACTT

Predicted protein sequence – 240 amino acids

MESQIVRRRVNMITAHLTAHDDISASATHLFPMSCSSSLNSAIPRRYDNRMNYARQSSSSQACFMRTSEQEQGSCTESTA

AFKASDYAKKSSRAFEGPMFSRPANNCKHNGTVEEAPKFARPRFQLKERRNELESNGSEWSPKMDVAESGSMYVVSIELP

GVNINDIKVEVSHKSLIVSGNRSTQCKVASYLNGLVSAYHKKEIVQGPYRVFWPLPSNANKNRVSAEFVDGLLQITIPKL

P049P16 heat shock transcription factor based on P049P16 sequence homologous to GSVIVP00018812001 and the part of the coding sequence contained in SGN-U326545. One intron predicted downstream of the start codon/upstream of the stop codon. Protein coding sequence shown in bold type.

ATGGATAACTGTAATGGAGGATCAAGTTCTTCTTCTCCGGCGCCTTTTTTGTTGAAAACTTATGAACTGGTTGATGATTC

GTATACTAATCCAGTTGTTTCATGGAGCCATAACGGACGTAGCTTCGTTGTTTGGAATCCACCTGAATTCGCTAGAGATT

TGCTTCCGAAATACTTTAAGCATAACAATTTCTCAAGTTTTATCAGACAACTTAATACTTATGTAAGTAAAATTATTTCG

TAAAAATATCTCTATCGAATCATCACCAATTGTGTTTTGTTATTTGACGATATTCATTTATTTCTATTAGGGGTTTAGAA

AGGTTGATCCTGAACAATGGGAGTTTGCGAACGAGGATTTTTTAAGAGGACGTAGACATTTGTTGAAGAATATTTATAGA

CGAAAGCCGATCCATAGCCACTCTGCTGCAGCAGGAACAGGGCAATCTGTAGCTCCATTGACGGATTCTGAGAGACAGGA

GTATGAAGATGAAATCGAGAGGTTGAAGAGAGAAAACAGTCTTCTTCAGTCGTCTGCGGAGAATCAATTGAAATTCAATG

GGGAGTACGAAAGTGGAATTAAGTCTATGGAGCAACGTTTACAGAACGTTGCTCATAGACAGGGGAAATTGATTTCTCTT

TTAGCTCAATTACTACAAACACCTGGATTTTCATCTGATTTCACTCAAAGCGCGAGCAGGAAGAGACGATTGTTGATATC

AAATTACTTGATTGACGAGGAAAACTCACCAAAATTCGACTTGGAAATGGTTAAAAAGTTGGATTCATCAATCAATTTTT

GGGAGCGGTTTCTGTATGGTGTTCAAACACAAGATTTCGAGCATACACATTCCCCAATTGTTACACATACATCATCTAAT

GATTCTGCCAAACGAAACTCTCCCATCGATCATTCACCATCCTCCTCCGAGTTAGGGCCATTGAATCCTGTCATGTCATC

AACTTATGAAAATTTAGAACGTCAACTTAAGCCATCTGATAATCAGATTGAGTGTAAGACCAGTAAAACATCTGAATTAG

TATCAAACTCGGGTAATGATGTATTTTGGCAACAGTTCTTAACAGAGACGCCTGGTTGCACTGAGCCACAACAAGTTGAG

AACAAAGGGATAAACGAATCAACGCGTGATATTAGATTAGGGGATAGCCATAGATATTGGTGGAATCGCGGAGTTAATTT

AGAAAATCTTGCTGAAAGAATGGGACATCTTAGTAGTCCAGCAACAGGAAGC

Predicted coding sequence

ATGGATAACTGTAATGGAGGATCAAGTTCTTCTTCTCCGGCGCCTTTTTTGTTGAAAACTTATGAACTGGTTGATGATTC

GTATACTAATCCAGTTGTTTCATGGAGCCATAACGGACGTAGCTTCGTTGTTTGGAATCCACCTGAATTCGCTAGAGATT

TGCTTCCGAAATACTTTAAGCATAACAATTTCTCAAGTTTTATCAGACAACTTAATACTTATGGGTTTAGAAAGGTTGAT

CCTGAACAATGGGAGTTTGCGAACGAGGATTTTTTAAGAGGACGTAGACATTTGTTGAAGAATATTTATAGACGAAAGCC

GATCCATAGCCACTCTGCTGCAGCAGGAACAGGGCAATCTGTAGCTCCATTGACGGATTCTGAGAGACAGGAGTATGAAG

ATGAAATCGAGAGGTTGAAGAGAGAAAACAGTCTTCTTCAGTCGTCTGCGGAGAATCAATTGAAATTCAATGGGGAGTAC

GAAAGTGGAATTAAGTCTATGGAGCAACGTTTACAGAACGTTGCTCATAGACAGGGGAAATTGATTTCTCTTTTAGCTCA

ATTACTACAAACACCTGGATTTTCATCTGATTTCACTCAAAGCGCGAGCAGGAAGAGACGATTGTTGATATCAAATTACT

TGATTGACGAGGAAAACTCACCAAAATTCGACTTGGAAATGGTTAAAAAGTTGGATTCATCAATCAATTTTTGGGAGCGG

TTTCTGTATGGTGTTCAAACACAAGATTTCGAGCATACACATTCCCCAATTGTTACACATACATCATCTAATGATTCTGC

CAAACGAAACTCTCCCATCGATCATTCACCATCCTCCTCCGAGTTAGGGCCATTGAATCCTGTCATGTCATCAACTTATG

AAAATTTAGAACGTCAACTTAAGCCATCTGATAATCAGATTGAGTGTAAGACCAGTAAAACATCTGAATTAGTATCAAAC

TCGGGTAATGATGTATTTTGGCAACAGTTCTTAACAGAGACGCCTGGTTGCACTGAGCCACAACAAGTTGAGAACAAAGG

GATAAACGAATCAACGCGTGATATTAGATTAGGGGATAGCCATAGATATTGGTGGAATCGCGGAGTTAATTTAGAAAATC

TTGCTGAAAGAATGGGACATCTTAGTAGTCCAGCAACAGGAAGC

Predicted protein sequence – 388 amino acids

MDNCNGGSSSSSPAPFLLKTYELVDDSYTNPVVSWSHNGRSFVVWNPPEFARDLLPKYFKHNNFSSFIRQLNTYGFRKVD

PEQWEFANEDFLRGRRHLLKNIYRRKPIHSHSAAAGTGQSVAPLTDSERQEYEDEIERLKRENSLLQSSAENQLKFNGEY

ESGIKSMEQRLQNVAHRQGKLISLLAQLLQTPGFSSDFTQSASRKRRLLISNYLIDEENSPKFDLEMVKKLDSSINFWER

FLYGVQTQDFEHTHSPIVTHTSSNDSAKRNSPIDHSPSSSELGPLNPVMSSTYENLERQLKPSDNQIECKTSKTSELVSN

SGNDVFWQQFLTETPGCTEPQQVENKGINESTRDIRLGDSHRYWWNRGVNLENLAERMGHLSSPATGS

P049P16 phosphate translocator gene similar to At1g06470. Nine introns predicted downstream of the start codon/upstream of the stop codon. Protein coding sequence shown in bold type.

ATGAAGGGTGGTGGTGATTTGGCTGTTGCATCTACTACGAATGGAAAAGATAGATATGTTCCGTTTGATGTGGAGAACGG

TTCTAGAAGTAATCAAACATATTCAAATGTGCACGGGGAAGGATCTACTCATCTGGACCACCACGGTGCATCACAAACAA

AGTCAAAGAATGTTGTTTCCGTAGCTGATGTGCTGAAGACACTGTTCTTAGTCCTTGTATGGTACATATTCAGTACATTC

TTGACATTGTAAGTCTACTTGGTCATGAGCTTATGATTTTACTAAGTTATTTGTTTTCTCTTATCTGTGTTGAAGCTTTG

GACACATTGGTTCTTATCTTGCATTCATTTGGTCTAGGTATAATAAAACTCTTCTAGGGGATCATCTAGGGAGATTCCCT

GCTCCTTTACTGATGAATACATTCCACTTCGCAATGCAAGCCATTTTGTCCAAAGGCATTACTTGGTTCTGGTCCCGAAA

ATTTCAACCCACTGTAAAGATGACTTGGAGAGATTATTTTTTGAGAGGTAACTATGATTGTCAATTTGTCATATCCTTTT

TCTTTAAGCTATACTGAGATACAGGTTATATTTGTTTTATGCGTTATTATGGGTTTTCAACAGACTGTTCATTGTTTTCT

ACTGTGTGATTATAAATAGCTCTAGATGCAAGGAACTGTTCTGACCTTCAGTTCCTTTAAAGAAATCAGTAGAGAAACAG

AGACCAGAGTAGGTAAGATAAAAATATTGAAATATTTGAGATTGTATGCCAATTTATTAGCAGGAGATTGTAACCCAAGG

GTTCTATATTAGGCACACTTCTTTTCTTGTAAAGTTTGTCTGTAAGATTCATTATTGGGAAGACAAACTGCCTGATCCTT

GCTAGTTCTGTTACCTTTCTCAAAAAATGATCCTTGCATAGTTCTGTTACCTTTCTCAAAAATGATCCTTGCATAGTTCT

ATGTTCCCAGTTCGAACACCTTTTTAACTTGTGGCTTCAACTAGCAAGCCACTTAGCACAACCCCACATTTCTTTTTTGA

ATTTTAGTTGTAAAAACAACAGGAAAATGAGTTCTGAGATTTGTACAATGATGAATGACTAGTAACGCCTATTTATGATT

TAGGAGTCATTAAAGTCCGAAAAAGTGTCAGACTAACTTACATCTATCACGCACCTCAAAAGATAAAGATGGTTAACACC

TAAGCTCTATAGAGAACCTAGAGTTCCTCTCCTTCCACCCTATCCATACAATGTACAATTATAACATTCCGTAGGACTTT

AGGTTGCTTTGGTTTCTTCGGGCCTCTCTTGTTGATGACCTCCTTTAGATGAGTATGACTTTGATACGGATGATAAGAAA

TGACCTTGGTGCCTAACTCAACTGCAAAAGTTAGCTCATAATGTGGGGATTGTCCAAGACCATATAATGAGACCAATTAT

AAGCATTTAGATGAAATGGTTACACAATTCAACATGATATAAGAGGCAGAACATGTCTTGGGTTCGAGTCTTACTGCTAT

CCTTTATCAAAAAGAATTTCCATGTGGTTGACTCATAAAAAAGAATCAACCCTCAAGTAAGGGGGCGTGTTGAATATATA

ATAAAATACATAAATGTGTATTCTATCTAACAAGTTAAGCTTTTAGATAAGATTATTGCACACTTCAACATGGTATTAAA

GCAGCCGAGGTCTTGGATTCGGGTCACCACCATCAATTATCAAAAAGAGTTTCCACGACCCCCACTTGAGAAGATTTGTT

GATAACATATATTTTTAATAAGAAAAGCAGTTATTAAAATGCCTGCAAAGGGAATCGTACTCGGACACATAAAAAAAATA

AAGAATTTTTTGCGGCCTGCATGAATTAACGGCACCCAAAGCTGCTTTTGTGCATTGAAGCATATTTGCTCTCTCTGACA

TCATAAAGTTGCATTGCTCGTTCTTCTTTTATTTAAAACATTTAATCTTATGCCCTTTATTTGAAGCTGTTTTGTGAAGT

CTAGAGCATTACTTCTAGATATTGGCCTCCAATAGTTTCCTGCCAATTTTTATTGACTTTTCTGACAACTAATGCTACAG

ATGGCCTTTGCCTTTCACAGTTGTTCCCACAGCTCTCAGTACGGCAATGGATGTCAACCTAAGCAATGCATCCCTTGTTT

TCATATCAGTGACATTTGCTACTATGGTGTGTATTCGTTTTCCCTGTAAATTTTAACATACCAATCAAATGGTCAACAGA

TTTGTTAAGAAAATTAAGTCACTGGGCAAACTCAAAAAGGATTCTCACAACCCAGCATTCCTTTAGGTCTGTAGAAGCAC

TTCCGAATTCTAACAACAATTTGTGAGATTGCAATAAGAATAATTTTCAAAGACTTGAAGGGAGAGTTAGTGAAACGATC

TTCAACTATTACTCGTAAAAAAGAATAATCCTCTAGTTTCCTTCATTTTCCTCCATAAATTCTTGACTCCTAAACACAAG

TTTGTCATTGCAGTGCAAATCTGCAGCACCGATCTTTCTCCTACTCTTCGCTTTTGCTTTCAGGTACTTCATTTAATCAT

TGCTCTATTTTTCATTGAGTCTTTACTATATTTAATAGATGCATCTCCTGTTGAATTATTCGTCAATCTGCATAGTAACT

ACTTGATATGTCTTAATGGACACTCCTCTTTTTTTAGTCTGCTTTAAAAGAATGCCATATTTCTACAATTCAAAGTGCTT

TTTGGCTGTAAACTTTTCACTTTACCCGCAATTATACGCAGTTAAAGCCATAGAAATATTATGACTTGTATACGACAATA

ATTTCTAAGGGTAATTTTGGTATGTGCCAGAAGTCTGTTTTCTCTCTCTTAAACTCTGCATAACAAAAACTCTGCCATAT

ATTTAATGGAGGGAGTAGCCATTTTGGCATATAAGGATCTTCAATTTTTGACGGACTGTTTCTTGTCCAGGAAAAAAAAA

TCTATATAGTCCATCTTTAAGCTCAGTCTCCATGAACTCAAAGGAAGCAGGATACAACCATCACTTGTTGATTTTCAATT

AGTCCCTCATTAGTGGTACACATACTGAGAAAGAAGTCTTTTTCCTGTCCATTGCATACTTGACCCTTCAAGCATTAAAT

TTATCATCCATCTCTCATGAATGATTTCATTTGCTCTCTCTTAAAAATGAGTTCTTATTTGAGTATATTTGGTCTACTGC

CTTGTTTTTAACCTCATATTTTTTTTGAAAGGTTGGAGTCTCCGAGTTTGAAGCTGCTAGGGATCATGTTGATTATTTCT

ATTGGGGTATTATTAACAGGTATCCTATACACTTATTAGCATATTTGTTTGTTCTTTCTTCCTTTTTTTTAATTTTATTT

TTGGGTAATATCAGTTATGCACACGCTAGGTAGCTTGTCCTTGTGAAGGTAATCTGACTTACCAATGCTGGAACCGATAG

ACTCACTCATACCTAGTGTTGTAGGAACTCAAACCTGGGATCTCCAGGTTGGGCCTCAACCAATGAGCCATCCCTAGCTT

CTTAACTTTTGAAGATCTCCCTATTTATCTGCCACTTTTCTTATATGACATTAATAATTCTCATTTTGTATGCTGGTAAA

AGTAGTGCTTTGAGTCTATATGTGTTTCAGACTTATTGTTTTCTATTCTATTTTAAAAATCATGATCCATGCATGACTAT

CATTTTTTGTTTAAAAATAACAAGGATGGGACCGAAATGTGCTGGACTCGATATGAATTTCATTTGTTTCAATTACATTT

CTCCATTGTCTTGGCTGTAGCCTTTAAAAATCATTACTTTTTATAAGTAAGTTTTTACTTTCTTAAAATTAAGAAAGGAA

TATTTTGGGGCTCGAGTTTCTAGAATTGCTATTTCATACCTAATAATCTGACTTTCTATCCTCTTCATTTGTTTTAGTCA

TGACACATTCTCTTTTCAACTATAAGGTGGCTAAAAATATATATATTTATACAAATACTCGCTGGAATGAGAAAGTTGAG

ATGGATACTATGTTGAACAAGAAAGGAAAGGTACAATAACACAAGTATTGAAAATGCGGAGGATAGTGATTGGGTAGTGG

CTCCACTAGGTAGTGTGAAGAAATAGTTTAAAATCATTCTCATTTCACAGTTTTTCTTATAGCAACGGTGATATCAGTTG

GAAAAAGCACTTCTAATACCACTGATGCGAAGAGTAAAAAAAAAAATCGTAACAAATGAGATGCCAAGAGTAATTGCACC

TAAAGGTGTGGCCTAGTGGTCAATAAAGTGGATGCAAACCTTGGAGACCCAGGTTGAAATTGCAGTAGAAGCAAAAGTAC

TTGGTGATTTCTTTGTATTTACCCCTTAAGAGAGTTGAGTTACTTGGTAGTTGTGTTGGCGAGAGGTAGTAGGTGGAATA

GCAGAGATGCGTGCCAGCTAGTATGGACACCAAAAAGGGAGATGAAAAGAGTAATTTTAGAGAAATGTCATGACTTATTA

GTCAATAATATATACATTGAATGTAGATAAAAGAAAACCGAGAAAAATGGAACTTACGCAGCATAGATGAATATATAAGA

AAATGCCGAAGTAGTTTGTGGTTCTCTTCAAAACTCTCTCTGTCCATTTTTTTTACCTTGTTATTTTCAGTTTTTTGAGT

GCTTAGCTACTTTATATGTTGTGATTAATTCTGTTGTCTGTAGACGGATATATGTTCAATAAGCACATCTGACCTTTATT

TATCGACAATACAGTTGCAAAGGAAACGGAGTTTGAATTTTGGGGGTTTATCTTTGTTATGCTAGCTGCTGTTATGTCTG

GGTTCCGCTGGACTATGACTCAGATACTTCTGCAGGTAGGATTCCAGAAATTGTTAAAAGTGAATTTGTTTTTAAAGTAT

TTTCATCATCATACTTGTGCTCACTTTGTTTATTTTGTGTTCATTCTCCTGTACTCCATCCAACGGGCGTGCGCTGACCA

AAAACTGTCATAAAGAAAGAAATCTACGGTAAGGACTTCCAGCAAATTATAGCTAGCTATCAAAGCACTGAAAATGAATT

TATTCGTAGAGTATTTCTGTTGATTAATATTGTTGGTGGATGATTGCATGTTGGTGACTCAGTTCTTCATTTACCTAGTT

TTGGATTCCCCTAAAAAGTATTCTATTTATTATTTTTGTTTTGTCACATTTTGTTTTAACCCTAGTCTGGCCAAATTTGA

TAGTTCAATTTTTTGTTTGGATAGTTTAAGTTCTGGTAAGCAACATTTATTGCAGGTGGAATTCATAGATAGCCTCTTAA

ACTTGCCACCAACTGCCAAGTGTACACTTAAGTATACACCTTAACTATTCAGTGATCAGTTAGACACCTCTTTCTGGCAG

AACTTTCTCATGACCCCTCAAGATGACATGGCAAAACACATTATTTTCAGTCGAATTTGAGCGCATGAAGCTCCTTAAAA

TTTGACTCAGTACTTAGAGTGCAAGTTCAGGGACATAATTCACGTGTCAGATGTGGAGGTGAAAATCGGTACACGTGTCA

TAATCAAAAGAGAGTTTCAAGTATCTTGAGTCAATAATCCAAGGAAGTGGGGAGATTAATGATGATGTTACATATCGTAT

TGATACATGGTGGATGAAATTGAGGCTCACATCCGGTGTCTTATGCGATAACAAAGTGGTTGTCTCGTATTGCCGCAGGA

GTTAGACAAGTTTTTTCGGTTCCAAGTCTCGCGTCCATACTACTTCGTTAAATTTTCCTCTGACTTTTACAACCTTATTT

ACAAGGCCTTAATTCTTGGAGGAAAGTAACAAATTTCCTGTCAGTGGCCCGATCCCATAAGAGCATTTCATAAGCTTGTG

AGAAAGTTCAAACTAATGTAGTGGTCTTTTGATGCCCCATCCACACTTTCCCAAGAAATGCACGAAGTGCTTAGTCTTTT

TCTCGGCACTTATGGGACCTGTAAACAAAAATAAGTAGTACATTGGAATTATTAAAATGTTAAGCCAGATAAAAGTGAGT

ACGCTCTCTGAGTTCAAAGAACAATTTTCTACTCATCTAATCTATAAGGCATTCTTTGAGTTGCACGAATCCCGAACACT

CCTTCTGTCTTAATTTAGGCGACCCTCTCTGCTTTTTAGTCAATCCCCCTCCAAAATGGCTCTCTTCTATATCTAGTTAC

AATTTAACTTTAAACTTCTCATTTTGATCCTTGATAAGGTAATTTATAGCCACACAAATATCTATGGCTTGTTTTAGACC

ACAAATTTCAAAAATATTTTTTTCAATCATAAACTTCGTGCTTATTCAAACACCTTCACATAACAGAGGGAGTTATCGTT

GTGTTTCTTTCTGGCAAAGTCATGTTTTACTTTTAAGAAAAGTAGCTAGTTGTAATTTAATATAGTGAGATATGTCCTTT

GAAATATTAACCATGTAGCTTGTATATACGCTGTATATGTCAACACTTTCTTCTGTTTTTTCAGGTTTAAAAAATCCACT

CACACTAATGAGCTACGTTACTCCAGTAATGGCTCTTTCAACTGCTATGCTGTCTCTGATTTTTGATCCATGGCAAGAGT

TTGGAAGCAGCAGTTACTTCGATAGCTCATGGCACATAACTAGAAGTTGTTTGCTGATGCTTTTTGGTGGAACCTTGGCT

TTCTTTATGGTATGCATGTATCTGACTCCATGTCAATAAGTCCAAATTGTTGATTATCCAACATTCTAGTGGCAAATTTC

TTTGCTGGCTCTTTTCCATTTGCAGAAAGTTGTTGTCTACTAAAATACTATAATATCTAAAAGCAAAAACAAATTCGATA

GACCTTCTATGCATGTTGTACAAATGATTCTTCCTCTGCTTTTTTTTTTCCAGGTGTTGACGGAATATATTCTCGTCTCT

GTTACTAGTGCAGTAACAGTGACAATAGCAGGAGTCGTAAAGGAGGCTGTCACTATCGTGGTATAAGCTAAAAACCAAGT

TATCTATATCTCTTTTCTTTAGTGAAGTAATTTAACTGACTTATCAAAGAAAAAAGAGCATACAAGTAATGTAGCTGAAT

AACTGGTTTAGTTATTCAAATTTCATCAGTTACCTGATAGCAGTTTACTCTATGGAATTTGTAATTTGTTTCTTCTCGAT

GAACATTGAGATTGTTAATTAAAAATCCTGGAAATTTCTTCCCCAGGTCCCGTGAATGGTTATGTAGGATGTAACTGCAA

TTTTTCTGCTACAAATGCTTATATTGCTCAGACTTCATTTTCCTAGATATCTTCACTTCAAGCTACTGTGTATCTTCAAT

CGAATTAGACTGATATCAAATCAGTTTTCACAAGTTGAAAAGTATCTCTGATTTTTGGAATCTGTTGTTGCTTCAGTTTC

TGAAACTAATTGGCAATTATGTCGGTGGCATTTTCAGGTTGCTGTGTTTTACTTCCATGATAAGTTTACCTGGATGAAAG

GGGTCGGTCTCATCACAATAATGTTTGGTGTGAGTTTGTTTAATTTGTACAAGTAAGTTTATGAGCTCTCATATTTTTGC

GAGAAGTTGTCATGTGATTTTTGTCTCCCAACTGCTGTTGATATTAGATAAATTTTCTCTTTAACGACCTACTGTGGATG

TCTATCCTTTAATTTTGCGACACCGCTTTGCATTTAATTTCAACTTATCTAGTATTTTTACTAGCTCTTGAATATTCTTT

TATAGCGTAGCCAGGGTTTTACGGGAAACATGTCGGTGACATATTCCACTTGAGTGACAGCATCTAGTCAAACTGTACTT

GTTAATAAGTGGTCTTGCAAATCGCTAATAATATAGGGTTGTCATGAAAATTATAAGAAGATTTGAAGTGTCAGATTGTT

TTTGCTAGGTATTAAATTTGTTTTCTGCTTCCTCTTCTCAGGTATGACAAATTACAGAAAGGTAATCCAAATGAAGATGA

AATTTCACGATCCTCAATGCAAAATGAGGCTGCAAAGTATGTTATTCTTGAAGAATTGGAAGATCAAGATGATGGTCCT

Predicted coding sequence

ATGAAGGGTGGTGGTGATTTGGCTGTTGCATCTACTACGAATGGAAAAGATAGATATGTTCCGTTTGATGTGGAGAACGG

TTCTAGAAGTAATCAAACATATTCAAATGTGCACGGGGAAGGATCTACTCATCTGGACCACCACGGTGCATCACAAACAA

AGTCAAAGAATGTTGTTTCCGTAGCTGATGTGCTGAAGACACTGTTCTTAGTCCTTGTATGGTACATATTCAGTACATTC

TTGACATTGTATAATAAAACTCTTCTAGGGGATCATCTAGGGAGATTCCCTGCTCCTTTACTGATGAATACATTCCACTT

CGCAATGCAAGCCATTTTGTCCAAAGGCATTACTTGGTTCTGGTCCCGAAAATTTCAACCCACTGTAAAGATGACTTGGA

GAGATTATTTTTTGAGAGTTGTTCCCACAGCTCTCAGTACGGCAATGGATGTCAACCTAAGCAATGCATCCCTTGTTTTC

ATATCAGTGACATTTGCTACTATGTGCAAATCTGCAGCACCGATCTTTCTCCTACTCTTCGCTTTTGCTTTCAGGTTGGA

GTCTCCGAGTTTGAAGCTGCTAGGGATCATGTTGATTATTTCTATTGGGGTATTATTAACAGTTGCAAAGGAAACGGAGT

TTGAATTTTGGGGGTTTATCTTTGTTATGCTAGCTGCTGTTATGTCTGGGTTCCGCTGGACTATGACTCAGATACTTCTG

CAGGTAGGTTTAAAAAATCCACTCACACTAATGAGCTACGTTACTCCAGTAATGGCTCTTTCAACTGCTATGCTGTCTCT

GATTTTTGATCCATGGCAAGAGTTTGGAAGCAGCAGTTACTTCGATAGCTCATGGCACATAACTAGAAGTTGTTTGCTGA

TGCTTTTTGGTGGAACCTTGGCTTTCTTTATGGTGTTGACGGAATATATTCTCGTCTCTGTTACTAGTGCAGTAACAGTG

ACAATAGCAGGAGTCGTAAAGGAGGCTGTCACTATCGTGGTTGCTGTGTTTTACTTCCATGATAAGTTTACCTGGATGAA

AGGGGTCGGTCTCATCACAATAATGTTTGGTGTGAGTTTGTTTAATTTGTACAAGTATGACAAATTACAGAAAGGTAATC

CAAATGAAGATGAAATTTCACGATCCTCAATGCAAAATGAGGCTGCAAAGTATGTTATTCTTGAAGAATTGGAAGATCAA

GATGATGGTCCT

Predicted protein – 404 amino acids

MKGGGDLAVASTTNGKDRYVPFDVENGSRSNQTYSNVHGEGSTHLDHHGASQTKSKNVVSVADVLKTLFLVLVWYIFSTF

LTLYNKTLLGDHLGRFPAPLLMNTFHFAMQAILSKGITWFWSRKFQPTVKMTWRDYFLRVVPTALSTAMDVNLSNASLVF

ISVTFATMCKSAAPIFLLLFAFAFRLESPSLKLLGIMLIISIGVLLTVAKETEFEFWGFIFVMLAAVMSGFRWTMTQILL

QVGLKNPLTLMSYVTPVMALSTAMLSLIFDPWQEFGSSSYFDSSWHITRSCLLMLFGGTLAFFMVLTEYILVSVTSAVTV

TIAGVVKEAVTIVVAVFYFHDKFTWMKGVGLITIMFGVSLFNLYKYDKLQKGNPNEDEISRSSMQNEAAKYVILEELEDQ

DDGP

P166A09 cytochrome P450 sequence similar to At3g14610-90. Four introns predicted downstream of the start codon/upstream of the stop codon. Protein coding sequence shown in bold type.

ATGGAGATTTTGTATAACACAATTATAGCAATAATTTGTGTTGCAATATTGTTGGTATATACATGGAGAGTGTTGAATTG

GGCATGGTTTAGGCCAAAAAAATTGGAGAATTTCTTAAGGCAAAGAGGTCTAAAAGGAAATCCATATAAGTTACTCTATG

GAGATTTGAATGAACTCACAAAAAGTATAGTTGAAGCTAAGTCTAAGTCAATCAATATCTCTGATGATATAACTCAAAGG

CTTATCCCTTTTTTCCTTGACTCCATCAACAAAAATGGTATGTTTATTTTATTGATTCGACTAGAAAGTAAACACTGCAA

CTTTGAGTATGCATGTCTAAACACCTTAACTTTATGTGATTCGTTTATCTAAACTTTATGTGTCACGTACGAGACACGGT

GGAGACAAGTTGGAAGTGTTTAGTTGCTAGTTGGACCAAGTTTAGGAGTCTAGATTTGCACCTCAAAGTTGGAGTGTTTA

CTTGTCAGCTGATATCATATTTGAGTGTTTGTTTATGTAGTATATGCCTTTTTTTATAATTGAAAATGGATTTTTGGCAG

GTAAAAGTTCTTTCATGTGGCTAGGCCCATATCCAACAGTGTTGATCACAAATCCTGAACATGTAAAAGAGATTTTGACA

AAGAATTATGTGTACCTAAAGCAAACTCATCCAAATCCATTTGCAAAGTTATTGGCTCAAGGTCTTGTGTTGGTTGAGGA

AGACAAATGGGCAAAACACAGAAAAATAATCAATCCTGCTTTCCATGTTGAGAAGTTAAAGGTTAAATATACTTCTTTTT

TGTTGTATTGAATTGGGATATGGCACAAGTATCCCCTAGATTATGATCGAAATCTCACAGATACACCTTAACTAATCTAA

GGTCCTATTACTCCATAAACTCATTTTTTGTGTAATTTTGTACAACTTTTGGCTTACGTGACACACTCTGTGACTCCACT

TAAGTGAGGCGCGTGGGAGATGTTTGGAGGTCACGTAGGCCAAAAAAGGTGTACAAAATTACAAAAAAAAAAGTTCAAGG

GTAATAGAACCTCAGTTTAGTTAAGGTGCGTCTCTAAAATTTCGGTCATAGACTATGGTTACTAGTCTCTTATCCCTATT

GAATTTAGGCCAAAAAAAGCAGAAAATTCAATTTTCTTTTTTTTTTTCATTTGTTTTGTACAGCATATGTTGCCAGCATT

TTATATGAGTTGTAGTGAAATGATAAGCAAATGGGAGGATATTGTTTCAAAGGAAACATCATACGAGCTCGATGTATGGC

CAGACCTTCAAATAATGACCAGTGAAGTTATTTCTCGAACCGCATTTGGTAGTAGCTATGAAGAAGGGAGAATAGTGTTT

GAACTTCAGCAAGAACAAGCTGAGCATATAATGGACATAAGTCGTTCAATATATATACCAGGATCGAGGTATGATAATTT

ACTTTTGAGATTTCTACATAATACGGAAACTAAAATGTTCATTACTTAAATTTGTTGTGTTAGGTTCTTGCCTACTAAAA

GGAACAAAAGAATGCTCGAAATCGAAAAGCAAATTCAAACAACGATTAGGCATATCATCGACAAAAGATTGAGGGCAATG

GAAGCAGGGGAGACTAGTAAAGATGATTTATTAGGCATATTACTTGAATCCAATATGAAAGAAATTGAACAACACGGAAA

CAAAGATTTCGGATTGACAACAACAGAAGTGATTGAAGAATGCAAGTTATTCTATTTTGCTGGACAGGAGACCACTTCAG

TGTTGCTCGTGTGGACGATGGTTTTGCTATGCCTACATCCAGAGTGGCAAGTACGGGCCAGAGAGGAGGTTTTACAGGTC

TTCGGAAATGAAAAACCAGATTTGGAAGGACTAAGTCACCTCAAAATTGTAAGTACTTTCCGCTATGTCGTTGGCATAGA

TCAAACTTCAACAATCAAGGAAACTATAAAATCAGGATAAAACAAGTAGCTGTTAATGTGAAATCGTTCCGACTGGGCTC

AGATAGCTAGGCCACTTCTATAATCCTATTTCAGTCTCGGAAGGGCAATTACTATGAGACTAAAATATCTCGCGAAGGCA

TGACCCCTGAATTTTGTAAGAAGTGAACTAATTCTACTTCCAACTTACGCAATGTATTTTTTTTCCATAGGTGACAATGA

TCTTATACGAGACATTAAGGCTATTCCCCCCATTACCGGTATTTAGTAGAAGGAACAAAGAAGAAGTCAAATTAGGGGAG

CTGCAGCTACCAGCTGAAGTGATACTTATTATACCTGCAATCTTTATTCATTATGACAAGGAAATATGGGGCGAAGATGC

GAAGGAATTCAAACCAGAAAGATTCAGTGAAGGAGTGTCAAAGGCAACAAAAGGTCAAGTCTCGTTTATTCCGTTTGGTT

GGGGACCTCGAATTTGCATCGGACAAAACTTTGCAATGATGGAAGCAAAAATGGCAATAGCAATGATACTACAAAAGTTC

TCCTTTGAACTCTCTCCGTCTTATACGCATGCTCCATTTGCAACAATTACTATTCATCCACAGTATGGTGCTCCTCTGCT

TCTGCGCAAACAT

Predicted coding sequence

ATGGAGATTTTGTATAACACAATTATAGCAATAATTTGTGTTGCAATATTGTTGGTATATACATGGAGAGTGTTGAATTG

GGCATGGTTTAGGCCAAAAAAATTGGAGAATTTCTTAAGGCAAAGAGGTCTAAAAGGAAATCCATATAAGTTACTCTATG

GAGATTTGAATGAACTCACAAAAAGTATAGTTGAAGCTAAGTCTAAGTCAATCAATATCTCTGATGATATAACTCAAAGG

CTTATCCCTTTTTTCCTTGACTCCATCAACAAAAATGGTAAAAGTTCTTTCATGTGGCTAGGCCCATATCCAACAGTGTT

GATCACAAATCCTGAACATGTAAAAGAGATTTTGACAAAGAATTATGTGTACCTAAAGCAAACTCATCCAAATCCATTTG

CAAAGTTATTGGCTCAAGGTCTTGTGTTGGTTGAGGAAGACAAATGGGCAAAACACAGAAAAATAATCAATCCTGCTTTC

CATGTTGAGAAGTTAAAGCATATGTTGCCAGCATTTTATATGAGTTGTAGTGAAATGATAAGCAAATGGGAGGATATTGT

TTCAAAGGAAACATCATACGAGCTCGATGTATGGCCAGACCTTCAAATAATGACCAGTGAAGTTATTTCTCGAACCGCAT

TTGGTAGTAGCTATGAAGAAGGGAGAATAGTGTTTGAACTTCAGCAAGAACAAGCTGAGCATATAATGGACATAAGTCGT

TCAATATATATACCAGGATCGAGGTTCTTGCCTACTAAAAGGAACAAAAGAATGCTCGAAATCGAAAAGCAAATTCAAAC

AACGATTAGGCATATCATCGACAAAAGATTGAGGGCAATGGAAGCAGGGGAGACTAGTAAAGATGATTTATTAGGCATAT

TACTTGAATCCAATATGAAAGAAATTGAACAACACGGAAACAAAGATTTCGGATTGACAACAACAGAAGTGATTGAAGAA

TGCAAGTTATTCTATTTTGCTGGACAGGAGACCACTTCAGTGTTGCTCGTGTGGACGATGGTTTTGCTATGCCTACATCC

AGAGTGGCAAGTACGGGCCAGAGAGGAGGTTTTACAGGTCTTCGGAAATGAAAAACCAGATTTGGAAGGACTAAGTCACC

TCAAAATTGTGACAATGATCTTATACGAGACATTAAGGCTATTCCCCCCATTACCGGTATTTAGTAGAAGGAACAAAGAA

GAAGTCAAATTAGGGGAGCTGCAGCTACCAGCTGAAGTGATACTTATTATACCTGCAATCTTTATTCATTATGACAAGGA

AATATGGGGCGAAGATGCGAAGGAATTCAAACCAGAAAGATTCAGTGAAGGAGTGTCAAAGGCAACAAAAGGTCAAGTCT

CGTTTATTCCGTTTGGTTGGGGACCTCGAATTTGCATCGGACAAAACTTTGCAATGATGGAAGCAAAAATGGCAATAGCA

ATGATACTACAAAAGTTCTCCTTTGAACTCTCTCCGTCTTATACGCATGCTCCATTTGCAACAATTACTATTCATCCACA

GTATGGTGCTCCTCTGCTTCTGCGCAAACAT

Predicted protein sequence – 516 amino acids

MEILYNTIIAIICVAILLVYTWRVLNWAWFRPKKLENFLRQRGLKGNPYKLLYGDLNELTKSIVEAKSKSINISDDITQL

IPFFLDSINKNGKSSFMWLGPYPTVLITNPEHVKEILTKNYVYLKQTHPNPFAKLLAQGLVLVEEDKWAKHRKIINPAFH

VEKLKHMLPAFYMSCSEMISKWEDIVSKETSYELDVWPDLQIMTSEVISRTAFGSSYEEGRIVFELQQEQAEHIMDISRS

IYIPGSRFLPTKRNKRMLEIEKQIQTTIRHIIDKRLRAMEAGETSKDDLLGILLESNMKEIEQHGNKDFGLTTTEVIEEC

KLFYFAGQETTSVLLVWTMVLLCLHPEWQVRAREEVLQVFGNEKPDLEGLSHLKIVTMILYETLRLFPPLPVFSRRNKEE

VKLGELQLPAEVILIIPAIFIHYDKEIWGEDAKEFKPERFSEGVSKATKGQVSFIPFGWGPRICIGQNFAMMEAKMAIA

MILQKFSFELSPSYTHAPFATITIHPQYGAPLLLRKH

P023C09 ankyrin protein kinase gene similar to At3g58760. Ten introns predicted downstream of the start codon/upstream of the stop codon. Protein coding sequence shown in bold type. No corresponding SGN unigene.

ATGGAGTCAAAGTCGCAGTCAAGGTTTCCGCTGGGTAGACAATCATCTCTGGCGCCGGAGAAAGACGGCGTTTCCGACGA

CTCAGTTACCGCCGGCCATGGAGTCGATGAAGGTATGGATTCCGGTTTGAGGTTAATGTACATGACTAATGACGGTGATT

TGGAAGGTATGGAGGAACTTTTGGACTCCGGTACCAGTGTGAACTACAGGGATATAGATGGACGGACTGCGTTGCATATT

GCCGCTTGCCAGGGTTACGCTGATGTTGTTGATTTTCTGCTTAAAAATGGCGCTCAGGTGGATTCCATGGATCGTTGGGG

CAGTACGGTATACTTCATTTTTACTCTGTAATTAGATATCACTAACTTGTATATACGTCTAAAAGCTGGTCAAACTAGCA

GCTCAAACGCAGTTTTTGGCTAATGATATTTTGGGAATACTTCCATGCCCTTTCAGCAATCCTGATTCGATAAGTGATTT

ACCAGCATTTTCGTTCCAGTCTAGTATTCAACTTTCCAAACCGTCTTAGACTGTTAGTCATTTGGAAGTGGAATTACAGT

TTTTTTGCTTATATTTAACTCAGGTAATGCCCTATTTTTTGTATAGTTAGGGTGTGTTGGTGCGCAGGAAAATGTGGAAT

TGGGTGCAATGGCCTTGTCTACCTTGTTAAATATTCTTTTGGATAGATTGTGCTCGTTGGTTGAGCTATTAAGAAATGCT

TCTAAGCAAAAATAAGCCAATGTGAAGGTTAATATGACTTGCATGTTATCTTAATAACACCAAAAAAATATTAATTGATG

AAAAATTAGTTTGATATATCACATCAGAGTTTATTTATTTATTTTTAGTTTATTAATATTTGAACTCTTGAAAGCTGTAT

GGGAAAGAGATGTTCCAATTATCTTGGTTTCTAAATGAGAAGAGTGTTTTAACAAATTTAGACAAAGGAGTACGTCTGTT

TCTGGAGAAAATTTATGAATTCTTAATAGTGTTTAATCATTAGTATAGTGATGCTTTGTGAACGGAGTTAGACTCCAAGT

TGTACAGTGATGTCTACAGAGTGGAACATATGTGTGGTTATCTTTGGGTCTATTTTTGGCTTCTCACAGTAATGCAGTGA

AGTGACAAAGTATGATTAAATAGCCTCTTGCAGATGCAATATATTACAAGAATAATGATGTGGTCAAGCTTTTGGAAGTA

CATGGAGCGAAACCTGCGGTATGTCTCGACAACTAGATTGTAGGATCGAAGTGCCCTATGGTAATATGGCATAACCATTT

ACCTTATCTGTTTTACTTTTTACTTTAGGTGGCTCCCATGCATGTAGAAAATGTTCGTGAAATTCCAGAGTATGAAATTG

ATCCAAGAGAACTTGATTTTAGTAATAGTGTAAACATAACAAAGGTAACAACTTATTTCTCTTTGACTTGATAATTATGC

TTATTTGATCATTGCTCACTTTATTCTTTTGTTATTTGTGTTCTGTTATTGCATTAGATGTCTGCTGATTTTTCAGAATG

GGATGCTTGCCTTTGGTAACAAGTATACTGGCATGTTTTTCAAGTTTATTGCCAAGCTCTGTTTCCTCTTTAGTTATCTT

AGTTGATCAACCTGCCACGAATATACAACATATATTTTTGTTTAGGTTTCATTATTTACCCATTCCAAATGTTATTCATC

CATCGCAACATATATGACCTAATTTTGACTAGCTGGGGCATTCAGATGAGAAGGTTTAAAATGATAGTTTGGAAATTTGA

AGACGTGGGATAGCTAGAAGCAAGACGCTAGTTCAACTTTAAGATAACATAAAGTTAAAATTAAAATATATTTACCTTAA

CATTTTGAAGAGGGAAAGTATTTGTGAGGTAGGCTACAGGTAAGTAGATCAAGAATTTGGGGTTGAATGAAGTATCTGCT

GTTATTATTGTATTTGTTTCTGGCAACTGTTTGCTTTAATCCTACCTGTTATTTCTAACTTCTTGTCTGTTGCTATGTAT

CTGGGATAAAAGTAGATGAACTTTCAATACTGCAATATATTTTCATATCATATTAAATGATTGTAGGGTACGTATTGTGT

TGCTCTGTGGCGTGGAACTAAGGTTGCTGTTAAGAAACTTGGTGAAGAATTATTCACCGACGAAGATAAAGTGTGGGTTG

GTCATAGACTATCTGTGATGTTAGAATTTGAACATTCCTCATTTGACAATTCATAAAAAATTACTAAAGACGCTTCTCTT

TGTTTTCTAACTGTTTTTCAGCAAGGCATTTGGGGATGAGCTTGCCTTAGTACAGAAGATACGCCACCCAAATGTAGTCC

AGTTTCTTGGTGCTGTGACACAGAGTAGCCCAATGATGATCGTCACAGAGTATCTGTCTAAGGTACTTCTGATTTAAAAG

AACAACTCACCACTTCCTGGAGTTATCTCCAGAACTTTGCTATGATGTCACAAAATCAAGGACTTATTGTAATTTGAAAT

TATCACAACGTCGAAATCAAGAACGACCATGCATCAAAATAGTATAATTGATGGTTAAGTATCAACAAAGTACTCAATAC

AAGGGCGTTAACGACTTCACAAATCACGCATATTATTTCATCATTGAAGACATGGTTCTGTTTTGTTTGTTGATCAAACG

AAATATTCCCCATTATTTATGTCAATTAAATTCATTAAAGTCGTTGAGAAAGCCTTTGAAGTCCCTGCAGATTTAAAGTA

TACCATTGATTCTGTTCTTATTCAGGGAGATCTTCGTGCATTCTTGAAACGGAAAGGTGCATTAAAGCCAATAATGGCTG

TGAAGTTTGCACTGGATATTGCAAGGTCAGTTACTGGCTGATTTCCTCAAATTTTCACTTGAGAATCTTATTAGTTTTGC

ATGCATGCTGTTCACCTGGTGCTTGAATTTGCCTAAGGTGTCTGTTGATAAGTGGCCCATTACTACAGGAACACCAACTA

CAGTCTCTTCAATTCTATGTACAATTTAGAATTGTAACATTTATTTTGTACCTCTTCATGCATTTGTGTTTTTTCACCAT

TGGGTTATAAATTTTTCAACTTTGTTGATCTCAACAAAGTACTGTGCTGGACTTTGGGGTTCCATAATGATTATATCTTC

ATAGAAAGCATAGTAGTTGCGCAGCTTCATGATCAGTTGCAGAAGAAGCTGTGTACATAAATATGTTGAGAAACCTGAAT

TTATCTTTCTTATAGTTGCGCCTTTATGTCTCATATGGTCATATTTGTATACATTTTGCAGAGGAATAAACTACTTGCAT

GAGAATAAACCTGAAGCAATAATTCATCGAGACCTGGAGCCTGAGTATGTTATTATAGTCTTCCTGACTGTTTACCCGTG

GCCAGTCTCGTGCTTTGTTTGTTCTTTAGTGGCTGAAGCCTGACAAATGTATGGAAAACTTTTAATTTCTGAGTGAAATG

ACAGAAACATATTACGGGATGATTCTGGACTTCTGAAAGTTGCAGATTTTGGACTTAGTAAGCTGATGAAATTTACCAAA

ACTGTCAGGGAAGTTAGACCATTGGCGCGTCAAGAGGATTCATGTGAGTGTATCCCAGCATTTTCCGCGGTTGAAGAAAT

ATATTCACTCTAATGATTTGTTGCTGTTACTTTGTTGTCACTTTTTTGTTACTCTTATATTTATGCAAAGCGTATACGAA

CAATGGCTTTAAGCTCAAGTCTCATGGTTCTACTTTTCCTTTTAATTTTGATGAAGCAAATTTTCACCTCTGTTTCGGTG

TTTCCTTTCTAAGCTTCAGCATATGGTCGTTGAATTTTTTATTTGAAACTGAAAGTGACAAAGTGTTTGTATGGTCCTTG

AATTTTTTTGCCAGCAAATACTAAACCGTTCACGTTTTGACACTTAAATGGTTGTGCTAGTGAATGAAACTCTAGGATTT

GGGATAGGAGTATCTTGATTTTTTTTTGTTCATCAAAAGAACTATTCTCTTGAACATTTGGCAATAGAGTTTGAAGAGGA

GAACTAGAAAGTTATTTTAGAAAAAGAATATGCATAAGTACTGGTTGCCTCAAATTTTAGTTGATAGCACTCCTATTTAA

TCATTGTAGAATTATGGGTCTTTATACGCATGTTTTTAACAAGGAAATTGGTGTGATATTACGTTTTAGTATATGAGAAT

AACAAGTTGAATTGACCTCTTGGTTTACAGGGAGATATGTTGCTCCAGAAGTTCTTAAGCATGAGGAGTATGATACCAAG

GTGGATGTTTTCTCATTTGCTTTGATATTGCAAGAGGTAAGCTCTTCTAATTCTTAAAACTTTTCTCTCATGCATAAGCT

ACTTAAAAAGGATCTCCAGTTGTGCCTGTCTGGAAGAAAAAATGTTAGTTATCACTTCTTGCTTCGTAGATATTTTAAGT

TTTTTACTTTATTTAACTGAACTTTGAGTGTAATGCGTGCTAATGGGCATGATATCAGATTGATAGCCACCAATAGGTTG

GTATGTATGCATTCTAGAGGTCATCTCATGGAGTAAAAAGGCAACGGGGTCCTCCATATTTTGCAGTCGATGTTAGTTGT

TTCTAAAAAGATTGCATTGCCATCTACTGTCTCCTATTCTTATTTCTTGCAAATTTATGCTTATTCTACCTTATTAATTC

ACTCGGAACACCTTGACTGTTCCAGCATGTTTGTAAATCCCTTATTATTTAAGAGGGCCGTCGGGTAATTTAAATATGTA

TACACCTTAATATGCTTTCCGTTCCACAGATGATTGAAGGCTGTCCACCATTTTCCACGAAGCAGGAAATTGAGGTGGCC

AAAGCATATGTTGCAAATGAACGCCCTCCCTTTAAAGCTTCACAAAAGTTATATGCTCATGGATTGAGAAAGTAAGTCCC

TGTGCTTTTTTCGGTTCCCTTTAATAGTATTTAAAGTGATTATTTCAACAGGTTAATTGAGGATTGCTGGAAGGAGCAAC

CATCAAAAAGACCGACTTTTCAGCGAATAATTATCAGGTTGGAAGAAATTAACCGTATTCTTTTGCATAGAAGACGTTGG

AAGGTACAAATCTCTCTCTCCCGACTCCCTTCAGTTCGGTATTTCCAAAGTCTGGTCATATATAATAAATCAAGCTTCGG

TATGGTAAATTCTGCTTCAGTAATTCGG

Predicted coding sequence

ATGGAGTCAAAGTCGCAGTCAAGGTTTCCGCTGGGTAGACAATCATCTCTGGCGCCGGAGAAAGACGGCGTTTCCGACGA

CTCAGTTACCGCCGGCCATGGAGTCGATGAAGGTATGGATTCCGGTTTGAGGTTAATGTACATGACTAATGACGGTGATT

TGGAAGGTATGGAGGAACTTTTGGACTCCGGTACCAGTGTGAACTACAGGGATATAGATGGACGGACTGCGTTGCATATT

GCCGCTTGCCAGGGTTACGCTGATGTTGTTGATTTTCTGCTTAAAAATGGCGCTCAGGTGGATTCCATGGATCGTTGGGG

CAGTACGCCTCTTGCAGATGCAATATATTACAAGAATAATGATGTGGTCAAGCTTTTGGAAGTACATGGAGCGAAACCTG

CGGTGGCTCCCATGCATGTAGAAAATGTTCGTGAAATTCCAGAGTATGAAATTGATCCAAGAGAACTTGATTTTAGTAAT

AGTGTAAACATAACAAAGGGTACGTATTGTGTTGCTCTGTGGCGTGGAACTAAGGTTGCTGTTAAGAAACTTGGTGAAGA

ATTATTCACCGACGAAGATAAAGTGTGGGCATTTGGGGATGAGCTTGCCTTAGTACAGAAGATACGCCACCCAAATGTAG

TCCAGTTTCTTGGTGCTGTGACACAGAGTAGCCCAATGATGATCGTCACAGAGTATCTGTCTAAGGGAGATCTTCGTGCA

TTCTTGAAACGGAAAGGTGCATTAAAGCCAATAATGGCTGTGAAGTTTGCACTGGATATTGCAAGAGGAATAAACTACTT

GCATGAGAATAAACCTGAAGCAATAATTCATCGAGACCTGGAGCCTGAAAACATATTACGGGATGATTCTGGACTTCTGA

AAGTTGCAGATTTTGGACTTAGTAAGCTGATGAAATTTACCAAAACTGTCAGGGAAGTTAGACCATTGGCGCGTCAAGAG

GATTCATGGAGATATGTTGCTCCAGAAGTTCTTAAGCATGAGGAGTATGATACCAAGGTGGATGTTTTCTCATTTGCTTT

GATATTGCAAGAGATGATTGAAGGCTGTCCACCATTTTCCACGAAGCAGGAAATTGAGGTGGCCAAAGCATATGTTGCAA

ATGAACGCCCTCCCTTTAAAGCTTCACAAAAGTTATATGCTCATGGATTGAGAAAGTTAATTGAGGATTGCTGGAAGGAG

CAACCATCAAAAAGACCGACTTTTCAGCGAATAATTATCAGGTTGGAAGAAATTAACCGTATTCTTTTGCATAGAAGACG

TTGGAAGGTACAAATCTCTCTCTCCCGACTCCCTTCAGTTCGGTATTTCCAAAGTCTGGTCATATATAATAAATCAAGCT

TCGGTATGGTAAATTCTGCTTCAGTAATTCGG

Predicted protein sequence – 464 amino acids

MESKSQSRFPLGRQSSLAPEKDGVSDDSVTAGHGVDEGMDSGLRLMYMTNDGDLEGMEELLDSGTSVNYRDIDGRTALHI

AACQGYADVVDFLLKNGAQVDSMDRWGSTPLADAIYYKNNDVVKLLEVHGAKPAVAPMHVENVREIPEYEIDPRELDFSN

SVNITKGTYCVALWRGTKVAVKKLGEELFTDEDKVWAFGDELALVQKIRHPNVVQFLGAVTQSSPMMIVTEYLSKGDLRA

FLKRKGALKPIMAVKFALDIARGINYLHENKPEAIIHRDLEPENILRDDSGLLKVADFGLSKLMKFTKTVREVRPLARQE

DSWRYVAPEVLKHEEYDTKVDVFSFALILQEMIEGCPPFSTKQEIEVAKAYVANERPPFKASQKLYAHGLRKLIEDCWKE

QPSKRPTFQRIIIRLEEINRILLHRRRWKVQISLSRLPSVRYFQSLVIYNKSSFGMVNSASVIR