Supplementary Table 1.
List of genomic sequences, predicted coding sequences and predicted protein sequences for genes carried on BAC clones P049P16, P166A09 and P023C09 anchored to the I-3 region of tomato chromosome 7.
P049P16 strictosidine synthase gene 1 proximal to SP6 end of BAC and corresponding to marker bP16. Similar to At1g08470, At2g41290, At2g41300, At3g57010, At3g57020 and At3g57030. Gene lacks introns.
ATGAATGATTCAAATATACTATTGTTGTTCATTGCTACTGTAGCGTTATTTTCCTCAGTTAATTTAGCCTTTGATGATTC
GGAAAATGCGTTGAAATCCCAAAATGTACTCTCAAAATCCGAAATCATCCAACTTAATGGAGCAATTGGACCAGAGAGTG
TTGCTTTCGATCCAAATGGTGAAGGCCCATACATAGGCGTAGCCGATGGACGAATACTCAAGTTTCAAGGATCACATTGG
GCTGATTTTGCAGTCACTTCTTCTCAAAGGGAGAGTTGTACACTGCCTTTTGCACCAGAAATGGAGCATATATGTGGGAG
GCCATTAGGTTTACGATTCGATACAAAAACAGGGGAACTCTACATTGCTGATGCGTATTTCGGGCTCCAAGTTGTTGGAC
CAAAAGGAGGATTAGCTACACCGTTAATCCAAATATTAGAAGGTGAGCCTTCTTATCTTCCAAACGACGTTGATATTGAT
GATCAAGACGATGTGATTTACTTCACCGACACAAGCACAAGGTACCAACGCAGACAATTTGTCGACTCTCTTTTAAGCAG
AGACGCGACTGGCAGGCTAATGAAATATACTAAATCAACCAAAACAACTGAAATACTAATAAGAGGCCTTGCTTTTGCGA
ACGGTGTATCTTTGAGCAAAGACCGATCATTCGTACTAGTAGCTGAAACTTCTAATTTTAGAATTTTGAGGTACTGGCTT
AAAGGCCCTCTTGAGGGAACACATGATACATTTGCTGAGTTGCCAGGGTTTCCGGACAACATTAGAATGAACTCGAAAGG
GGAATTTTGGGTAGCTATACAAGCAATAAGATCACAATCGAGTTTTTCAAATTCGGAAATGGGAAATGAATTGTTGAAGC
TCCGATTCATCGCGCAAAAATTTAACAATTTGTTACGTGGAGGGCTGCTGCACGCTACAGCAATCAAGCTAAGCGAGGAC
GGGCGAGTTTTGGAGGTTCTAGAAGATGTTGAAGGCAAGACGTTGAGGTCTATAAGTGAAGTTCATGAGATATATGACAA
GTTGATGTTTGGTTCTGTTATAATGCCTTTTTTGGGAGTTTATGAATTA
Predicted protein - 363 amino acids
MNDSNILLLFIATVALFSSVNLAFDDSENALKSQNVLSKSEIIQLNGAIGPESVAFDPNGEGPYIGVADGRILKFQGSHW
ADFAVTSSQRESCTLPFAPEMEHICGRPLGLRFDTKTGELYIADAYFGLQVVGPKGGLATPLIQILEGEPSYLPNDVDID
DQDDVIYFTDTSTRYQRRQFVDSLLSRDATGRLMKYTKSTKTTEILIRGLAFANGVSLSKDRSFVLVAETSNFRILRYWL
KGPLEGTHDTFAELPGFPDNIRMNSKGEFWVAIQAIRSQSSFSNSEMGNELLKLRFIAQKFNNLLRGGLLHATAIKLSED
GRVLEVLEDVEGKTLRSISEVHEIYDKLMFGSVIMPFLGVYEL
P049P16 strictosidine synthase gene 2 distal to SP6 end of BAC relative to gene 1 and corresponding to SGN-U323940. Similar to At1g08470, At2g41290, At2g41300, At3g57010, At3g57020 and At3g57030. Gene lacks introns.
ATGAATGCTTCAAATATACTATTGTTGATTATCGTTGTACAACTTGTTTCAGTAAATTTAGCCTTTGAGAAAACTCAAAA
CGTTCTCTCAAAATCGAAAATTATCCATCTTAATGGGTCGATTGGACCGGAGAGTGTTGCGTTCGATCCAAATGGCGAAG
GTCCATACATAGGAGTAGCCGATGGACGCATTCTCAAGTTGCAATTAGGGTCAAATAATCGATTATTTTGGGCTGAATTC
GCGGTCACTTCTTCTCATCGAAGGGATTGTACCTCACCATTCGCTCCTAAAATGGAACATATATGTGGTAGGCCATTAGG
CTTACGATTCGATACAAAAACAGGTGAATTATACATTGCAGACGCGTATTTAGGTCTACAAGTTGTTGGACCCAAAGGTG
GACTAGCAACTCCATTAGTTCAAAAATTCGAAGGTAAACCTCTTGTTTTCACAAATGACGTTGACATTGACGATGATGTG
ATTTATTTCACGGATACAAGCACCAAGTATCAACGCTGGCAGTTTCTAACGTCGTTTTCAAGTGGTGATACGACTGGTAG
GTTGATGAAATATGATAAATCTACGAAAAAAGTAACAGTCTTATTAGGTGATCTTGCTTTTGCAAATGGCGTTGCGTTGA
GTAAAAACAAATCGTTTGTTTTAGTGACTGAAACTACAAATTTTAGAATTTTAAGGTATTGGCTTAAAGGCCCCTTAGTA
GGAACACATGATGTATTTGTTGAGTTGCCCGGGTTCCCGGACAACATCAGAATAAACCCTAAAGGGGACTTTTGGGTCGC
GTTACAAGCAATAAGATCAGTACCCAGTGTTTCAGATTCGAAATTTGGAATGTTTAGTTTCAACCCTCAGCAAATGGGAG
ATGACGGGGAGCTACACCCTACCGCCCTCAAGCTAAGTGAGGACGGGCAAGTTTTGGAAGTTCTAGAAGATGTTGAAGGC
AAGACATTAAGGTCTATAAGTGAAATTGAAGAAAAAGATGGGAAGTTATGGATTGGTTCTGTTGTGATGCCTTTTTTGCG
AGTTTATGAAATG
Predicted - 351 amino acids
MNASNILLLIIVVQLVSVNLAFEKTQNVLSKSKIIHLNGSIGPESVAFDPNGEGPYIGVADGRILKLQLGSNNRLFWAEF
AVTSSHRRDCTSPFAPKMEHICGRPLGLRFDTKTGELYIADAYLGLQVVGPKGGLATPLVQKFEGKPLVFTNDVDIDDDV
IYFTDTSTKYQRWQFLTSFSSGDTTGRLMKYDKSTKKVTVLLGDLAFANGVALSKNKSFVLVTETTNFRILRYWLKGPLV
GTHDVFVELPGFPDNIRINPKGDFWVALQAIRSVPSVSDSKFGMFSFNPQQMGDDGELHPTALKLSEDGQVLEVLEDVEG
KTLRSISEIEEKDGKLWIGSVVMPFLRVYEM
P049P16 gene similar to At2g30900. Four introns predicted downstream of the start codon/upstream of the stop codon. Protein coding sequence shown in bold type.
ATGAAAAATTCTCTAATAATTTTTCATAATTGCTTCTTCAAATTACTAGTAATTATAATCAACATTATTTTGTTCATCAA
TAATAATGTTGATTTTCTAGTAGAAGCAAAACAAAACAAGCTACTACATCCTCCCTTCAAAAAAAAGGGTGCAAATTGTG
ATTTATATGATGGAAAATGGGTTATTGATTATAATTATCCACTTTATAATGCAAAAAATTGTCCATTTTTACTTCAACAA
TTTGATTGTGTAAAGAATGGTAGACCAGATAAAGCATATCTCAAGTATAGATGGCAACCCACAGATTGTAACTTAGCCAG
GTAATGAATTACATCTATCTATCTTTTTTATCGTGTTTTTCTTGCTGTCTTTCGAAAACGTCTATTTACCTCTATGAAGT
AATGGTTAAATCTATATATGTTTTATCTTTTTTGTATGGTACTTAATGAAATAATACTGAATATGTTAGTATTATTCGTA
TAAATAATAGATAAAAAAATAAATAGATAGAGAAATTTTGAACGAATTGTTTCATCTTGTATGTATCGAAAGTTGATTGA
TGACAAGTGGCTGATAAAAGTTACTTATATTTAAAAAGCCAATGCTTATGGTGAGGGTCGAGGCGGAGAAATTAGAAATT
TCGTTAAAGAAAGTTTTAAGAATTAATATATACATAATTTTATATATATATATATATATATATATATATATATATATATA
TAATATATTTTTTTAACGAAAGATGATTAACTAACATTCTTTCGTTGTATATGGCTGAGTCACTAAACGAAGACCATATT
TTATTGTGACATTTGAAAAATATGATTTTTACTTTAAAAATCGAAAATGATACTGAAAATGAAAGTTATGCATAATTACG
GATACAAATTAGAGTTGTTTTTTTAAATTTTTTTTATGAGAGAAAAAAGTGAAAAATACTTTTTGTTATTTTCTAAAACT
CTATTTTTTACATTCTAGTTGAATTCCATATGCTTATTGTCAAATGTGCTTTCCCAAGTTCAACTTTAGAGAAGAAAAAA
ATTGAAACAATTTCATAGACAAACAAATATTCGATTTCTCACTTTATAATATTCTTTTCGTTTAAAAAAAAAAATATTCT
CCCCAATTCTTTAATCTCCTATCTAATATTTTTTTAAATAAATATAAAACAGATGAAAAAACTTGTCTCATCTATATCGT
GCTTCGTAAATATTCGATTATCTAGGTGAACATGTTTTGCTTGATAATTGAATTATTTGTTTTCGCGCATTCTGTTTTTT
GCCATTTACGTTGTTGAGTCCTCTCTACAAACCAAAATGTTACTTTCTACTTATCGTCTCAACTTATATCATAATTCAAA
ATTTATCGTGACTTATAATATTTTTATGTAATTTTAAATATATAAATTATTTTTTAATTTCTTAAAAATTATATGACCAA
ATGAATGGTCAAAATGAAAATTAGTAATTTAAATGATATCATACAAATTGAAATGAAAAAAATAATTAAGATTTCTTGAT
GAATTACTAATCAATTAAGGAATTTTTCTAATAGTAAATAATTTCACGAGATCACGAATTGATGCAATTAATATCCAAAA
TAGGTGGGAATACTGCATTTGTAGATTAGTAATTTATGAAGAAAATAATTAAGATTCCTTGATAAATTACTAATCTACAA
ATAAAATATTCTCGCCTATGTTAAATATTAATTGCATCAATTTGTAACCTTGTGAAATTATTTATTGTTAGAAATTTAAG
GCATTTATGATATAAACTTGTTTTTCACGTGTTATACAACTTGTAACTAACAATAGACAAATTTTATATATATATATATA
TATATATATATATATATATATGTTAATAGTGTTTTATTTGTAAAGTTTTTATCAAAAAATATTTTAGAAAATAAAAAATC
AAGTCTTTCAAACTAACTAGTTTTTTGTGGGATGAATGGTAGAATGATCAATATTTTTCCTTTAAATTTTATGTTGACTA
TTATGTATTTTTGTAAGTATTCACCGAAGTATGTGATTCATAAATATATTTTTGTAAGGTATTCACCGAAGTGTCTGATT
CATAAATATATTTAGTAAGTATTTCTACGTATTAATGTCGTGTTCATAGACGTCAACGTTTGATACTCTTAGATACTCTT
TCTAAGGGAGTAACATTGTTATTTTTTGGTTGAAGGGCCAACTCGTGGCCCACTCAGGTCTGGACTGAGCTGCTATTTTA
TAGGCCCTTTAATTAAAGGATTAATGACAAAAATCCCACATTTAAGTTCTCTTATTACCATTATCCTCTATTAATTTACA
ATTTCCCAAAATTCCTCATTTTCATGCATCAGATCAATGTATCAGTGTATCAAATTAATGTATCTCTCGCATCAAATTAG
TGTATCATGTATAAAATGTATATCATATTAGTGTATCATGTATAAAATGTAATGTATCTTACTTAATGATTAATGTATCT
CGCTCATCAGATTAATGTATCAACGCTCATATTATTGTATCAGTTGGAGGGATTTTTGTAATTATAAACTTATAAGCGAC
AAATGGTAATGTTACCTTAAAAGTATGTGATTTCTGTCATTTGCCCTTAATTTTGATTAAAAGGGTCAGCCCATCCAACG
CGTTTAACTCTGTAGCCCGTTAGGGTTGGATCGGATACTCAGCCTATTTTAATAGCTCTAATGATTATAAATATTTTCAA
ACGAGTGACCAAACACATAACTATTTCCCTCTTTATTTTGTTATGTCTTTCCATGAAACATTAGTAAAAATACTTTCTTA
ATATTTGTGTACTGTCTAACGACTATAAATATTTTCGACAAGTGATCATTTACGTAACTATTTCCCTCTTTATTTTGTTA
TATGTCTTTCCATGATATGTATACTGACTAACGACTATAAATATTTTCTGCGAACGACCAAATACGTAACTATTTCCCTC
TTTATTTTTTTCTTATATATGTCTATCCATGTAAAAATAGTTTTTAAATTCTTGAGTTTAATTTTTGTATATACACATAT
AGGTGGGATGGAAGTGACTTCATGAGAAGAATTAAAAACAAGAAGGTATTATTCGTGGGAGATTCATTGAGCTTGAATCA
ATGGCAATCTTTGGCTTGCATGCTTCATTCTGCCTTTCCAAGTCTTAATTACTCTGTCACCAGAAATGGACCACTCATGT
CAACCTTTTCTATACCCGTAAGTGAATCGAGGTGAATTCAGAATTTAAATTTAATGAATTCGTATGATTTGTGAAGGGTA
TATTATGCATCTTCGTTGTTTTTATTTTTTAAAATTTGAATTTGATGCACTTAAATCGAATATCTATTGAAAATAGGAGG
CAGTAATAACTGATAATGTACAAATATACTTTACCTTTCTAAATCTCATCTAGTGACATTTTGCTGAATACGTTATTGTT
AATATATAGTATAATTATTTCTTTAATTCATTTTTATTTGTGCGTATTGATTTGAGATAGCTCTCAAGGTGCAATATATT
GAATATATATAGTAGACTCAATATTTTGACAAATGATGATAGTTATTAATAAATGATAAATTAACTAGAAATAAGTGATA
TAAATTATTACAAACTTAACCTCTAATATGGGTAATTAAAAGGGTTGACACATAATAATTGGATAAATTGTGAAGATTTC
TTCTTTTTTTAAAAAAATAAAAAAAATAAAAAATTTCCCATGTTTTTGGGGGGAATTGCATTTATGAGAGAAAGGGACTT
GACCTTACCTCATAAAGCACAACACAAGATAAAAATTGTGAATATTAATTGGGGGAGTTGTATTAAGTTATTGAAATAAT
AATTTTGTAACACTTTAGAATTTTTTATTATTTATATTATTAGGTTATCAGTTTGGAAGTATAGAGAAATAAAAAATATA
TATTTCAATTAATCAAATGTAATTATGTATCATACGGATCAACATCGATATTTATTTATATTTCAAGAATTGATAATATA
AAATCTCAAGATATACACACATAACTGATCAGGACCAAAAATACTAGATTCAACTGAACTTATTAACTAAAACTAATTTA
TCTATCCTCTTTTATGCTTAATTTCTCACATTTGTCTTTCAATATAATATTGTTAATGTCAAATTGATAATAATCTCTCT
AATAATGTTTTTTTTAAAGAAATTACATTGTTGAATTTATGTAGTCAAAGCAAGTGAGATTGAGTTATGTGAGAAATGCA
TTGCTAGTAGACATAGTGAAGGAGAAATCAAAAAGAGTATTAAAGTTGGACTCAGTTGCAATTTCTTCAAAGCTGTGGAC
TGGTTATGACATTTTGATATTTGATACTTGGCATTGGTGGATTCATACGGGAAGAAAACAACCGTAAGTTTTAATTTTTA
TGAAAAAATATTAGAGATTTTGATGTCTAAATTGAGAACAACATATTATCGTGAGAGTGTCGAGAAGGTAGAATGTATGT
AGAGAAAATTGATGGACATGGTGGGTCTAAATATAGGGAGAAAATCGTTTTTGTTTGACAAATATTTTTTTAAAATTGAA
ACCGATGGATGTATGTCATAATTCATATCGAAATTTATATGATTGACCTCCTGATGGTCTTTCAGAAACAATATATTTGC
CTGTACGAGGTAATGATAAGCTCATCATAAACTCTATCCTTTTTAGACCCTTACTTAGTTCAATTTCACTGTTTATGTTA
TTGTTGTAGACCCTAGTTTATATTCTGTACAAAATAAATATCAACTAAATTGACACTAATTTTACAGATGGGATTTGATT
CGCGATGGGAAAATCCTACGTCGAGATATGGATCGTTTAAAAGCTTATGAAAAAGCCTTAATAACATGGGGTAAATGGAT
TTCCAACAACATTAATTTCAAGAAAACTAAGGTCTTTTTTCAAGGCATCTCACCTGATCATAGCAAGTAAGATTTCAAAT
ATTTCAAACTTTCGTGTCTGATCAAATAATGTCATATGAATTAACATTTTATTTTTTTACAGTGGCACTCAATGGGGTAA
AAAATCCAACCAAATGCAATGCAAAGGTGAACAAAATCCAGTAAAAAAACTGAGTTACTCAGGAGGTGAAGATGAAGCAG
ATATATTATTGGGGAAAATATTGAGCAAAACAAAAAAGCCAATACATATGTTGAAACTCAACAAAATGTCACAATATAGA
GTTGATGGTCATCCTTCTATTTATGGTAACCCTAGATATAAAGGAATGGATTGTACACATTGGTGTTTACCTGGTGTACC
TGATATTTGGAATCAACTTCTTTATGCTAATCTCATT
Predicted coding sequence
ATGAAAAATTCTCTAATAATTTTTCATAATTGCTTCTTCAAATTACTAGTAATTATAATCAACATTATTTTGTTCATCAA
TAATAATGTTGATTTTCTAGTAGAAGCAAAACAAAACAAGCTACTACATCCTCCCTTCAAAAAAAAGGGTGCAAATTGTG
ATTTATATGATGGAAAATGGGTTATTGATTATAATTATCCACTTTATAATGCAAAAAATTGTCCATTTTTACTTCAACAA
TTTGATTGTGTAAAGAATGGTAGACCAGATAAAGCATATCTCAAGTATAGATGGCAACCCACAGATTGTAACTTAGCCAG
GTGGGATGGAAGTGACTTCATGAGAAGAATTAAAAACAAGAAGGTATTATTCGTGGGAGATTCATTGAGCTTGAATCAAT
GGCAATCTTTGGCTTGCATGCTTCATTCTGCCTTTCCAAGTCTTAATTACTCTGTCACCAGAAATGGACCACTCATGTCA
ACCTTTTCTATACCCGTAAGTGAATCGAGATTGAGTTATGTGAGAAATGCATTGCTAGTAGACATAGTGAAGGAGAAATC
AAAAAGAGTATTAAAGTTGGACTCAGTTGCAATTTCTTCAAAGCTGTGGACTGGTTATGACATTTTGATATTTGATACTT
GGCATTGGTGGATTCATACGGGAAGAAAACAACCATGGGATTTGATTCGCGATGGGAAAATCCTACGTCGAGATATGGAT
CGTTTAAAAGCTTATGAAAAAGCCTTAATAACATGGGGTAAATGGATTTCCAACAACATTAATTTCAAGAAAACTAAGGT
CTTTTTTCAAGGCATCTCACCTGATCATAGCAATGGCACTCAATGGGGTAAAAAATCCAACCAAATGCAATGCAAAGGTG
AACAAAATCCAGTAAAAAAACTGAGTTACTCAGGAGGTGAAGATGAAGCAGATATATTATTGGGGAAAATATTGAGCAAA
ACAAAAAAGCCAATACATATGTTGAAACTCAACAAAATGTCACAATATAGAGTTGATGGTCATCCTTCTATTTATGGTAA
CCCTAGATATAAAGGAATGGATTGTACACATTGGTGTTTACCTGGTGTACCTGATATTTGGAATCAACTTCTTTATGCTA
ATCTCATT
Predicted protein sequence – 376 amino acids
MKNSLIIFHNCFFKLLVIIINIILFINNNVDFLVEAKQNKLLHPPFKKKGANCDLYDGKWVIDYNYPLYNAKNCPFLLQQ
FDCVKNGRPDKAYLKYRWQPTDCNLARWDGSDFMRRIKNKKVLFVGDSLSLNQWQSLACMLHSAFPSLNYSVTRNGPLMS
TFSIPVSESRLSYVRNALLVDIVKEKSKRVLKLDSVAISSKLWTGYDILIFDTWHWWIHTGRKQPWDLIRDGKILRRDMD
RLKAYEKALITWGKWISNNINFKKTKVFFQGISPDHSNGTQWGKKSNQMQCKGEQNPVKKLSYSGGEDEADILLGKILSK
TKKPIHMLKLNKMSQYRVDGHPSIYGNPRYKGMDCTHWCLPGVPDIWNQLLYANLI
P049P16 heat shock protein gene based on segments of chimeric unigenes U314912 and U314913 and P049P16 sequence corresponding to At1g06460. Five introns predicted downstream of the start codon/upstream of the stop codon. Protein coding sequence shown in bold type.
ATGGAGAGTCAAATTGTTCGACGAAGAGTTAACATGATTACTGCTCATTTAACTGCACATGATGATATTTCCGCCTCCGC
TACTCATCTCTTTCCTATGGTAATCTCTTTCTCTGTCTCTACTCATAGTAATGTTAGCAGGGACGGAGTTACAGGTTCGA
TAGAACTAGTAGCTTTCGCCAGCATTTCGTATTTATGTTTAAAAAATTATGAATAGTATAATTTATTTGAAGTAAAGTCA
AAGGTGTCTTTACGAGAATCCAGAACCTCTGAATGGTAGGACTTGTCACGAGCTAATTTGAAAATAAAGTAATCTACTCA
TAGCCCTTTGGTTAAAGTCATACCACTATTCATTTCCCCTGTTTCTTTTAACTATATATCTATTGATGTGCTTCTATTTG
ATTTTTCACTTTGTTTACTGTATAGAGCTGTAGCAGTAGCTTGAATTCTGCTATTCCGAGGAGGTACGATAACAGAATGA
ACTATGCAAGACAAAGTTCCAGTTCTCAAGCTTGTTTCATGAGGACAAGTGAACAGGTCTGGGAATTATTACTAATATAA
TTGACATTACTTTAGTTTCAATGAGTTTGTAATATTCGTTCTGCAGGTGTTAGCTTTTTTCATTTTTTTTTCTTGCTTTG
GGAGCAGGGAAGCTGTACTGAATCCACTGCGGCTTTCAAGGCTAGTGATTATGCAAAGAAGAGTTCTCGCGCCTTTGAAG
GACCAATGTTTTCTAGACCTGCAAATAATTGCAAACACAATGGAACTGTTGAAGAAGCTCCTAAATTTGCTAGGCCTCGT
TTCCAATTGAAAGAAAGAAGAAATGAACTTGAATCTAATGGTAAACAAACCTATGCTTTACTTTTGATTGTTATATCGCG
TAATTGAGAGGTACGTCCTCTTTGGAATGTTGAAACATTTCCTTTTGTTTTTGCTAATGCAGGGAGTGAATGGTCTCCTA
AGATGGATGTTGCAGAATCTGGAAGCATGTACGTCGTATCTATAGAACTTCCCGGTGTCAATATAAATGATATAAAGGTC
GAAGTCAGCCACAAAAGGTAAATAAATGACAACTATCCATTAGTCTTTCTTTGATTTCTCGTATAGTCACTATTATCTCA
GAATGTCAATTTCTTTGTGAGATCAGCATGTGTTATAAAGTTCCATCTTCTGCAAAGATGAATTCAATTTGCGTTGATCT
AATAGACGCGTGTTATGTTCCTTGACAGCTTAATAGTTTCTGGAAATCGTTCCACTCAGTGTAAAGTGGCATCATACTTG
AATGGCTTGGTATCAGCCTATCATAAAAAGGAGATTGTTCAGGGACCATACCGTGTTTTCTGGCCTCTTCCAAGTAATGC
TAATAAAAATCGCGTCTCAGCTGAGTTTGTGTAAGTTATCAATATTTGTGATTGTTTACCTATATATCGCCATGCTTAAT
GTTTTTAGTCGAGAAAAAACACTTCGTTACATATAGACTTGTGAAATTTCATGACTCTAAAACAATGCAGGGACGGACTT
TTACAGATTACAATCCCGAAACTT
Predicted coding sequence
ATGGAGAGTCAAATTGTTCGACGAAGAGTTAACATGATTACTGCTCATTTAACTGCACATGATGATATTTCCGCCTCCGC
TACTCATCTCTTTCCTATGAGCTGTAGCAGTAGCTTGAATTCTGCTATTCCGAGGAGGTACGATAACAGAATGAACTATG
CAAGACAAAGTTCCAGTTCTCAAGCTTGTTTCATGAGGACAAGTGAACAGGAGCAGGGAAGCTGTACTGAATCCACTGCG
GCTTTCAAGGCTAGTGATTATGCAAAGAAGAGTTCTCGCGCCTTTGAAGGACCAATGTTTTCTAGACCTGCAAATAATTG
CAAACACAATGGAACTGTTGAAGAAGCTCCTAAATTTGCTAGGCCTCGTTTCCAATTGAAAGAAAGAAGAAATGAACTTG
AATCTAATGGGAGTGAATGGTCTCCTAAGATGGATGTTGCAGAATCTGGAAGCATGTACGTCGTATCTATAGAACTTCCC
GGTGTCAATATAAATGATATAAAGGTCGAAGTCAGCCACAAAAGCTTAATAGTTTCTGGAAATCGTTCCACTCAGTGTAA
AGTGGCATCATACTTGAATGGCTTGGTATCAGCCTATCATAAAAAGGAGATTGTTCAGGGACCATACCGTGTTTTCTGGC
CTCTTCCAAGTAATGCTAATAAAAATCGCGTCTCAGCTGAGTTTGTGGACGGACTTTTACAGATTACAATCCCGAAACTT
Predicted protein sequence – 240 amino acids
MESQIVRRRVNMITAHLTAHDDISASATHLFPMSCSSSLNSAIPRRYDNRMNYARQSSSSQACFMRTSEQEQGSCTESTA
AFKASDYAKKSSRAFEGPMFSRPANNCKHNGTVEEAPKFARPRFQLKERRNELESNGSEWSPKMDVAESGSMYVVSIELP
GVNINDIKVEVSHKSLIVSGNRSTQCKVASYLNGLVSAYHKKEIVQGPYRVFWPLPSNANKNRVSAEFVDGLLQITIPKL
P049P16 heat shock transcription factor based on P049P16 sequence homologous to GSVIVP00018812001 and the part of the coding sequence contained in SGN-U326545. One intron predicted downstream of the start codon/upstream of the stop codon. Protein coding sequence shown in bold type.
ATGGATAACTGTAATGGAGGATCAAGTTCTTCTTCTCCGGCGCCTTTTTTGTTGAAAACTTATGAACTGGTTGATGATTC
GTATACTAATCCAGTTGTTTCATGGAGCCATAACGGACGTAGCTTCGTTGTTTGGAATCCACCTGAATTCGCTAGAGATT
TGCTTCCGAAATACTTTAAGCATAACAATTTCTCAAGTTTTATCAGACAACTTAATACTTATGTAAGTAAAATTATTTCG
TAAAAATATCTCTATCGAATCATCACCAATTGTGTTTTGTTATTTGACGATATTCATTTATTTCTATTAGGGGTTTAGAA
AGGTTGATCCTGAACAATGGGAGTTTGCGAACGAGGATTTTTTAAGAGGACGTAGACATTTGTTGAAGAATATTTATAGA
CGAAAGCCGATCCATAGCCACTCTGCTGCAGCAGGAACAGGGCAATCTGTAGCTCCATTGACGGATTCTGAGAGACAGGA
GTATGAAGATGAAATCGAGAGGTTGAAGAGAGAAAACAGTCTTCTTCAGTCGTCTGCGGAGAATCAATTGAAATTCAATG
GGGAGTACGAAAGTGGAATTAAGTCTATGGAGCAACGTTTACAGAACGTTGCTCATAGACAGGGGAAATTGATTTCTCTT
TTAGCTCAATTACTACAAACACCTGGATTTTCATCTGATTTCACTCAAAGCGCGAGCAGGAAGAGACGATTGTTGATATC
AAATTACTTGATTGACGAGGAAAACTCACCAAAATTCGACTTGGAAATGGTTAAAAAGTTGGATTCATCAATCAATTTTT
GGGAGCGGTTTCTGTATGGTGTTCAAACACAAGATTTCGAGCATACACATTCCCCAATTGTTACACATACATCATCTAAT
GATTCTGCCAAACGAAACTCTCCCATCGATCATTCACCATCCTCCTCCGAGTTAGGGCCATTGAATCCTGTCATGTCATC
AACTTATGAAAATTTAGAACGTCAACTTAAGCCATCTGATAATCAGATTGAGTGTAAGACCAGTAAAACATCTGAATTAG
TATCAAACTCGGGTAATGATGTATTTTGGCAACAGTTCTTAACAGAGACGCCTGGTTGCACTGAGCCACAACAAGTTGAG
AACAAAGGGATAAACGAATCAACGCGTGATATTAGATTAGGGGATAGCCATAGATATTGGTGGAATCGCGGAGTTAATTT
AGAAAATCTTGCTGAAAGAATGGGACATCTTAGTAGTCCAGCAACAGGAAGC
Predicted coding sequence
ATGGATAACTGTAATGGAGGATCAAGTTCTTCTTCTCCGGCGCCTTTTTTGTTGAAAACTTATGAACTGGTTGATGATTC
GTATACTAATCCAGTTGTTTCATGGAGCCATAACGGACGTAGCTTCGTTGTTTGGAATCCACCTGAATTCGCTAGAGATT
TGCTTCCGAAATACTTTAAGCATAACAATTTCTCAAGTTTTATCAGACAACTTAATACTTATGGGTTTAGAAAGGTTGAT
CCTGAACAATGGGAGTTTGCGAACGAGGATTTTTTAAGAGGACGTAGACATTTGTTGAAGAATATTTATAGACGAAAGCC
GATCCATAGCCACTCTGCTGCAGCAGGAACAGGGCAATCTGTAGCTCCATTGACGGATTCTGAGAGACAGGAGTATGAAG
ATGAAATCGAGAGGTTGAAGAGAGAAAACAGTCTTCTTCAGTCGTCTGCGGAGAATCAATTGAAATTCAATGGGGAGTAC
GAAAGTGGAATTAAGTCTATGGAGCAACGTTTACAGAACGTTGCTCATAGACAGGGGAAATTGATTTCTCTTTTAGCTCA
ATTACTACAAACACCTGGATTTTCATCTGATTTCACTCAAAGCGCGAGCAGGAAGAGACGATTGTTGATATCAAATTACT
TGATTGACGAGGAAAACTCACCAAAATTCGACTTGGAAATGGTTAAAAAGTTGGATTCATCAATCAATTTTTGGGAGCGG
TTTCTGTATGGTGTTCAAACACAAGATTTCGAGCATACACATTCCCCAATTGTTACACATACATCATCTAATGATTCTGC
CAAACGAAACTCTCCCATCGATCATTCACCATCCTCCTCCGAGTTAGGGCCATTGAATCCTGTCATGTCATCAACTTATG
AAAATTTAGAACGTCAACTTAAGCCATCTGATAATCAGATTGAGTGTAAGACCAGTAAAACATCTGAATTAGTATCAAAC
TCGGGTAATGATGTATTTTGGCAACAGTTCTTAACAGAGACGCCTGGTTGCACTGAGCCACAACAAGTTGAGAACAAAGG
GATAAACGAATCAACGCGTGATATTAGATTAGGGGATAGCCATAGATATTGGTGGAATCGCGGAGTTAATTTAGAAAATC
TTGCTGAAAGAATGGGACATCTTAGTAGTCCAGCAACAGGAAGC
Predicted protein sequence – 388 amino acids
MDNCNGGSSSSSPAPFLLKTYELVDDSYTNPVVSWSHNGRSFVVWNPPEFARDLLPKYFKHNNFSSFIRQLNTYGFRKVD
PEQWEFANEDFLRGRRHLLKNIYRRKPIHSHSAAAGTGQSVAPLTDSERQEYEDEIERLKRENSLLQSSAENQLKFNGEY
ESGIKSMEQRLQNVAHRQGKLISLLAQLLQTPGFSSDFTQSASRKRRLLISNYLIDEENSPKFDLEMVKKLDSSINFWER
FLYGVQTQDFEHTHSPIVTHTSSNDSAKRNSPIDHSPSSSELGPLNPVMSSTYENLERQLKPSDNQIECKTSKTSELVSN
SGNDVFWQQFLTETPGCTEPQQVENKGINESTRDIRLGDSHRYWWNRGVNLENLAERMGHLSSPATGS
P049P16 phosphate translocator gene similar to At1g06470. Nine introns predicted downstream of the start codon/upstream of the stop codon. Protein coding sequence shown in bold type.
ATGAAGGGTGGTGGTGATTTGGCTGTTGCATCTACTACGAATGGAAAAGATAGATATGTTCCGTTTGATGTGGAGAACGG
TTCTAGAAGTAATCAAACATATTCAAATGTGCACGGGGAAGGATCTACTCATCTGGACCACCACGGTGCATCACAAACAA
AGTCAAAGAATGTTGTTTCCGTAGCTGATGTGCTGAAGACACTGTTCTTAGTCCTTGTATGGTACATATTCAGTACATTC
TTGACATTGTAAGTCTACTTGGTCATGAGCTTATGATTTTACTAAGTTATTTGTTTTCTCTTATCTGTGTTGAAGCTTTG
GACACATTGGTTCTTATCTTGCATTCATTTGGTCTAGGTATAATAAAACTCTTCTAGGGGATCATCTAGGGAGATTCCCT
GCTCCTTTACTGATGAATACATTCCACTTCGCAATGCAAGCCATTTTGTCCAAAGGCATTACTTGGTTCTGGTCCCGAAA
ATTTCAACCCACTGTAAAGATGACTTGGAGAGATTATTTTTTGAGAGGTAACTATGATTGTCAATTTGTCATATCCTTTT
TCTTTAAGCTATACTGAGATACAGGTTATATTTGTTTTATGCGTTATTATGGGTTTTCAACAGACTGTTCATTGTTTTCT
ACTGTGTGATTATAAATAGCTCTAGATGCAAGGAACTGTTCTGACCTTCAGTTCCTTTAAAGAAATCAGTAGAGAAACAG
AGACCAGAGTAGGTAAGATAAAAATATTGAAATATTTGAGATTGTATGCCAATTTATTAGCAGGAGATTGTAACCCAAGG
GTTCTATATTAGGCACACTTCTTTTCTTGTAAAGTTTGTCTGTAAGATTCATTATTGGGAAGACAAACTGCCTGATCCTT
GCTAGTTCTGTTACCTTTCTCAAAAAATGATCCTTGCATAGTTCTGTTACCTTTCTCAAAAATGATCCTTGCATAGTTCT
ATGTTCCCAGTTCGAACACCTTTTTAACTTGTGGCTTCAACTAGCAAGCCACTTAGCACAACCCCACATTTCTTTTTTGA
ATTTTAGTTGTAAAAACAACAGGAAAATGAGTTCTGAGATTTGTACAATGATGAATGACTAGTAACGCCTATTTATGATT
TAGGAGTCATTAAAGTCCGAAAAAGTGTCAGACTAACTTACATCTATCACGCACCTCAAAAGATAAAGATGGTTAACACC
TAAGCTCTATAGAGAACCTAGAGTTCCTCTCCTTCCACCCTATCCATACAATGTACAATTATAACATTCCGTAGGACTTT
AGGTTGCTTTGGTTTCTTCGGGCCTCTCTTGTTGATGACCTCCTTTAGATGAGTATGACTTTGATACGGATGATAAGAAA
TGACCTTGGTGCCTAACTCAACTGCAAAAGTTAGCTCATAATGTGGGGATTGTCCAAGACCATATAATGAGACCAATTAT
AAGCATTTAGATGAAATGGTTACACAATTCAACATGATATAAGAGGCAGAACATGTCTTGGGTTCGAGTCTTACTGCTAT
CCTTTATCAAAAAGAATTTCCATGTGGTTGACTCATAAAAAAGAATCAACCCTCAAGTAAGGGGGCGTGTTGAATATATA
ATAAAATACATAAATGTGTATTCTATCTAACAAGTTAAGCTTTTAGATAAGATTATTGCACACTTCAACATGGTATTAAA
GCAGCCGAGGTCTTGGATTCGGGTCACCACCATCAATTATCAAAAAGAGTTTCCACGACCCCCACTTGAGAAGATTTGTT
GATAACATATATTTTTAATAAGAAAAGCAGTTATTAAAATGCCTGCAAAGGGAATCGTACTCGGACACATAAAAAAAATA
AAGAATTTTTTGCGGCCTGCATGAATTAACGGCACCCAAAGCTGCTTTTGTGCATTGAAGCATATTTGCTCTCTCTGACA
TCATAAAGTTGCATTGCTCGTTCTTCTTTTATTTAAAACATTTAATCTTATGCCCTTTATTTGAAGCTGTTTTGTGAAGT
CTAGAGCATTACTTCTAGATATTGGCCTCCAATAGTTTCCTGCCAATTTTTATTGACTTTTCTGACAACTAATGCTACAG
ATGGCCTTTGCCTTTCACAGTTGTTCCCACAGCTCTCAGTACGGCAATGGATGTCAACCTAAGCAATGCATCCCTTGTTT
TCATATCAGTGACATTTGCTACTATGGTGTGTATTCGTTTTCCCTGTAAATTTTAACATACCAATCAAATGGTCAACAGA
TTTGTTAAGAAAATTAAGTCACTGGGCAAACTCAAAAAGGATTCTCACAACCCAGCATTCCTTTAGGTCTGTAGAAGCAC
TTCCGAATTCTAACAACAATTTGTGAGATTGCAATAAGAATAATTTTCAAAGACTTGAAGGGAGAGTTAGTGAAACGATC
TTCAACTATTACTCGTAAAAAAGAATAATCCTCTAGTTTCCTTCATTTTCCTCCATAAATTCTTGACTCCTAAACACAAG
TTTGTCATTGCAGTGCAAATCTGCAGCACCGATCTTTCTCCTACTCTTCGCTTTTGCTTTCAGGTACTTCATTTAATCAT
TGCTCTATTTTTCATTGAGTCTTTACTATATTTAATAGATGCATCTCCTGTTGAATTATTCGTCAATCTGCATAGTAACT
ACTTGATATGTCTTAATGGACACTCCTCTTTTTTTAGTCTGCTTTAAAAGAATGCCATATTTCTACAATTCAAAGTGCTT
TTTGGCTGTAAACTTTTCACTTTACCCGCAATTATACGCAGTTAAAGCCATAGAAATATTATGACTTGTATACGACAATA
ATTTCTAAGGGTAATTTTGGTATGTGCCAGAAGTCTGTTTTCTCTCTCTTAAACTCTGCATAACAAAAACTCTGCCATAT
ATTTAATGGAGGGAGTAGCCATTTTGGCATATAAGGATCTTCAATTTTTGACGGACTGTTTCTTGTCCAGGAAAAAAAAA
TCTATATAGTCCATCTTTAAGCTCAGTCTCCATGAACTCAAAGGAAGCAGGATACAACCATCACTTGTTGATTTTCAATT
AGTCCCTCATTAGTGGTACACATACTGAGAAAGAAGTCTTTTTCCTGTCCATTGCATACTTGACCCTTCAAGCATTAAAT
TTATCATCCATCTCTCATGAATGATTTCATTTGCTCTCTCTTAAAAATGAGTTCTTATTTGAGTATATTTGGTCTACTGC
CTTGTTTTTAACCTCATATTTTTTTTGAAAGGTTGGAGTCTCCGAGTTTGAAGCTGCTAGGGATCATGTTGATTATTTCT
ATTGGGGTATTATTAACAGGTATCCTATACACTTATTAGCATATTTGTTTGTTCTTTCTTCCTTTTTTTTAATTTTATTT
TTGGGTAATATCAGTTATGCACACGCTAGGTAGCTTGTCCTTGTGAAGGTAATCTGACTTACCAATGCTGGAACCGATAG
ACTCACTCATACCTAGTGTTGTAGGAACTCAAACCTGGGATCTCCAGGTTGGGCCTCAACCAATGAGCCATCCCTAGCTT
CTTAACTTTTGAAGATCTCCCTATTTATCTGCCACTTTTCTTATATGACATTAATAATTCTCATTTTGTATGCTGGTAAA
AGTAGTGCTTTGAGTCTATATGTGTTTCAGACTTATTGTTTTCTATTCTATTTTAAAAATCATGATCCATGCATGACTAT
CATTTTTTGTTTAAAAATAACAAGGATGGGACCGAAATGTGCTGGACTCGATATGAATTTCATTTGTTTCAATTACATTT
CTCCATTGTCTTGGCTGTAGCCTTTAAAAATCATTACTTTTTATAAGTAAGTTTTTACTTTCTTAAAATTAAGAAAGGAA
TATTTTGGGGCTCGAGTTTCTAGAATTGCTATTTCATACCTAATAATCTGACTTTCTATCCTCTTCATTTGTTTTAGTCA
TGACACATTCTCTTTTCAACTATAAGGTGGCTAAAAATATATATATTTATACAAATACTCGCTGGAATGAGAAAGTTGAG
ATGGATACTATGTTGAACAAGAAAGGAAAGGTACAATAACACAAGTATTGAAAATGCGGAGGATAGTGATTGGGTAGTGG
CTCCACTAGGTAGTGTGAAGAAATAGTTTAAAATCATTCTCATTTCACAGTTTTTCTTATAGCAACGGTGATATCAGTTG
GAAAAAGCACTTCTAATACCACTGATGCGAAGAGTAAAAAAAAAAATCGTAACAAATGAGATGCCAAGAGTAATTGCACC
TAAAGGTGTGGCCTAGTGGTCAATAAAGTGGATGCAAACCTTGGAGACCCAGGTTGAAATTGCAGTAGAAGCAAAAGTAC
TTGGTGATTTCTTTGTATTTACCCCTTAAGAGAGTTGAGTTACTTGGTAGTTGTGTTGGCGAGAGGTAGTAGGTGGAATA
GCAGAGATGCGTGCCAGCTAGTATGGACACCAAAAAGGGAGATGAAAAGAGTAATTTTAGAGAAATGTCATGACTTATTA
GTCAATAATATATACATTGAATGTAGATAAAAGAAAACCGAGAAAAATGGAACTTACGCAGCATAGATGAATATATAAGA
AAATGCCGAAGTAGTTTGTGGTTCTCTTCAAAACTCTCTCTGTCCATTTTTTTTACCTTGTTATTTTCAGTTTTTTGAGT
GCTTAGCTACTTTATATGTTGTGATTAATTCTGTTGTCTGTAGACGGATATATGTTCAATAAGCACATCTGACCTTTATT
TATCGACAATACAGTTGCAAAGGAAACGGAGTTTGAATTTTGGGGGTTTATCTTTGTTATGCTAGCTGCTGTTATGTCTG
GGTTCCGCTGGACTATGACTCAGATACTTCTGCAGGTAGGATTCCAGAAATTGTTAAAAGTGAATTTGTTTTTAAAGTAT
TTTCATCATCATACTTGTGCTCACTTTGTTTATTTTGTGTTCATTCTCCTGTACTCCATCCAACGGGCGTGCGCTGACCA
AAAACTGTCATAAAGAAAGAAATCTACGGTAAGGACTTCCAGCAAATTATAGCTAGCTATCAAAGCACTGAAAATGAATT
TATTCGTAGAGTATTTCTGTTGATTAATATTGTTGGTGGATGATTGCATGTTGGTGACTCAGTTCTTCATTTACCTAGTT
TTGGATTCCCCTAAAAAGTATTCTATTTATTATTTTTGTTTTGTCACATTTTGTTTTAACCCTAGTCTGGCCAAATTTGA
TAGTTCAATTTTTTGTTTGGATAGTTTAAGTTCTGGTAAGCAACATTTATTGCAGGTGGAATTCATAGATAGCCTCTTAA
ACTTGCCACCAACTGCCAAGTGTACACTTAAGTATACACCTTAACTATTCAGTGATCAGTTAGACACCTCTTTCTGGCAG
AACTTTCTCATGACCCCTCAAGATGACATGGCAAAACACATTATTTTCAGTCGAATTTGAGCGCATGAAGCTCCTTAAAA
TTTGACTCAGTACTTAGAGTGCAAGTTCAGGGACATAATTCACGTGTCAGATGTGGAGGTGAAAATCGGTACACGTGTCA
TAATCAAAAGAGAGTTTCAAGTATCTTGAGTCAATAATCCAAGGAAGTGGGGAGATTAATGATGATGTTACATATCGTAT
TGATACATGGTGGATGAAATTGAGGCTCACATCCGGTGTCTTATGCGATAACAAAGTGGTTGTCTCGTATTGCCGCAGGA
GTTAGACAAGTTTTTTCGGTTCCAAGTCTCGCGTCCATACTACTTCGTTAAATTTTCCTCTGACTTTTACAACCTTATTT
ACAAGGCCTTAATTCTTGGAGGAAAGTAACAAATTTCCTGTCAGTGGCCCGATCCCATAAGAGCATTTCATAAGCTTGTG
AGAAAGTTCAAACTAATGTAGTGGTCTTTTGATGCCCCATCCACACTTTCCCAAGAAATGCACGAAGTGCTTAGTCTTTT
TCTCGGCACTTATGGGACCTGTAAACAAAAATAAGTAGTACATTGGAATTATTAAAATGTTAAGCCAGATAAAAGTGAGT
ACGCTCTCTGAGTTCAAAGAACAATTTTCTACTCATCTAATCTATAAGGCATTCTTTGAGTTGCACGAATCCCGAACACT
CCTTCTGTCTTAATTTAGGCGACCCTCTCTGCTTTTTAGTCAATCCCCCTCCAAAATGGCTCTCTTCTATATCTAGTTAC
AATTTAACTTTAAACTTCTCATTTTGATCCTTGATAAGGTAATTTATAGCCACACAAATATCTATGGCTTGTTTTAGACC
ACAAATTTCAAAAATATTTTTTTCAATCATAAACTTCGTGCTTATTCAAACACCTTCACATAACAGAGGGAGTTATCGTT
GTGTTTCTTTCTGGCAAAGTCATGTTTTACTTTTAAGAAAAGTAGCTAGTTGTAATTTAATATAGTGAGATATGTCCTTT
GAAATATTAACCATGTAGCTTGTATATACGCTGTATATGTCAACACTTTCTTCTGTTTTTTCAGGTTTAAAAAATCCACT
CACACTAATGAGCTACGTTACTCCAGTAATGGCTCTTTCAACTGCTATGCTGTCTCTGATTTTTGATCCATGGCAAGAGT
TTGGAAGCAGCAGTTACTTCGATAGCTCATGGCACATAACTAGAAGTTGTTTGCTGATGCTTTTTGGTGGAACCTTGGCT
TTCTTTATGGTATGCATGTATCTGACTCCATGTCAATAAGTCCAAATTGTTGATTATCCAACATTCTAGTGGCAAATTTC
TTTGCTGGCTCTTTTCCATTTGCAGAAAGTTGTTGTCTACTAAAATACTATAATATCTAAAAGCAAAAACAAATTCGATA
GACCTTCTATGCATGTTGTACAAATGATTCTTCCTCTGCTTTTTTTTTTCCAGGTGTTGACGGAATATATTCTCGTCTCT
GTTACTAGTGCAGTAACAGTGACAATAGCAGGAGTCGTAAAGGAGGCTGTCACTATCGTGGTATAAGCTAAAAACCAAGT
TATCTATATCTCTTTTCTTTAGTGAAGTAATTTAACTGACTTATCAAAGAAAAAAGAGCATACAAGTAATGTAGCTGAAT
AACTGGTTTAGTTATTCAAATTTCATCAGTTACCTGATAGCAGTTTACTCTATGGAATTTGTAATTTGTTTCTTCTCGAT
GAACATTGAGATTGTTAATTAAAAATCCTGGAAATTTCTTCCCCAGGTCCCGTGAATGGTTATGTAGGATGTAACTGCAA
TTTTTCTGCTACAAATGCTTATATTGCTCAGACTTCATTTTCCTAGATATCTTCACTTCAAGCTACTGTGTATCTTCAAT
CGAATTAGACTGATATCAAATCAGTTTTCACAAGTTGAAAAGTATCTCTGATTTTTGGAATCTGTTGTTGCTTCAGTTTC
TGAAACTAATTGGCAATTATGTCGGTGGCATTTTCAGGTTGCTGTGTTTTACTTCCATGATAAGTTTACCTGGATGAAAG
GGGTCGGTCTCATCACAATAATGTTTGGTGTGAGTTTGTTTAATTTGTACAAGTAAGTTTATGAGCTCTCATATTTTTGC
GAGAAGTTGTCATGTGATTTTTGTCTCCCAACTGCTGTTGATATTAGATAAATTTTCTCTTTAACGACCTACTGTGGATG
TCTATCCTTTAATTTTGCGACACCGCTTTGCATTTAATTTCAACTTATCTAGTATTTTTACTAGCTCTTGAATATTCTTT
TATAGCGTAGCCAGGGTTTTACGGGAAACATGTCGGTGACATATTCCACTTGAGTGACAGCATCTAGTCAAACTGTACTT
GTTAATAAGTGGTCTTGCAAATCGCTAATAATATAGGGTTGTCATGAAAATTATAAGAAGATTTGAAGTGTCAGATTGTT
TTTGCTAGGTATTAAATTTGTTTTCTGCTTCCTCTTCTCAGGTATGACAAATTACAGAAAGGTAATCCAAATGAAGATGA
AATTTCACGATCCTCAATGCAAAATGAGGCTGCAAAGTATGTTATTCTTGAAGAATTGGAAGATCAAGATGATGGTCCT
Predicted coding sequence
ATGAAGGGTGGTGGTGATTTGGCTGTTGCATCTACTACGAATGGAAAAGATAGATATGTTCCGTTTGATGTGGAGAACGG
TTCTAGAAGTAATCAAACATATTCAAATGTGCACGGGGAAGGATCTACTCATCTGGACCACCACGGTGCATCACAAACAA
AGTCAAAGAATGTTGTTTCCGTAGCTGATGTGCTGAAGACACTGTTCTTAGTCCTTGTATGGTACATATTCAGTACATTC
TTGACATTGTATAATAAAACTCTTCTAGGGGATCATCTAGGGAGATTCCCTGCTCCTTTACTGATGAATACATTCCACTT
CGCAATGCAAGCCATTTTGTCCAAAGGCATTACTTGGTTCTGGTCCCGAAAATTTCAACCCACTGTAAAGATGACTTGGA
GAGATTATTTTTTGAGAGTTGTTCCCACAGCTCTCAGTACGGCAATGGATGTCAACCTAAGCAATGCATCCCTTGTTTTC
ATATCAGTGACATTTGCTACTATGTGCAAATCTGCAGCACCGATCTTTCTCCTACTCTTCGCTTTTGCTTTCAGGTTGGA
GTCTCCGAGTTTGAAGCTGCTAGGGATCATGTTGATTATTTCTATTGGGGTATTATTAACAGTTGCAAAGGAAACGGAGT
TTGAATTTTGGGGGTTTATCTTTGTTATGCTAGCTGCTGTTATGTCTGGGTTCCGCTGGACTATGACTCAGATACTTCTG
CAGGTAGGTTTAAAAAATCCACTCACACTAATGAGCTACGTTACTCCAGTAATGGCTCTTTCAACTGCTATGCTGTCTCT
GATTTTTGATCCATGGCAAGAGTTTGGAAGCAGCAGTTACTTCGATAGCTCATGGCACATAACTAGAAGTTGTTTGCTGA
TGCTTTTTGGTGGAACCTTGGCTTTCTTTATGGTGTTGACGGAATATATTCTCGTCTCTGTTACTAGTGCAGTAACAGTG
ACAATAGCAGGAGTCGTAAAGGAGGCTGTCACTATCGTGGTTGCTGTGTTTTACTTCCATGATAAGTTTACCTGGATGAA
AGGGGTCGGTCTCATCACAATAATGTTTGGTGTGAGTTTGTTTAATTTGTACAAGTATGACAAATTACAGAAAGGTAATC
CAAATGAAGATGAAATTTCACGATCCTCAATGCAAAATGAGGCTGCAAAGTATGTTATTCTTGAAGAATTGGAAGATCAA
GATGATGGTCCT
Predicted protein – 404 amino acids
MKGGGDLAVASTTNGKDRYVPFDVENGSRSNQTYSNVHGEGSTHLDHHGASQTKSKNVVSVADVLKTLFLVLVWYIFSTF
LTLYNKTLLGDHLGRFPAPLLMNTFHFAMQAILSKGITWFWSRKFQPTVKMTWRDYFLRVVPTALSTAMDVNLSNASLVF
ISVTFATMCKSAAPIFLLLFAFAFRLESPSLKLLGIMLIISIGVLLTVAKETEFEFWGFIFVMLAAVMSGFRWTMTQILL
QVGLKNPLTLMSYVTPVMALSTAMLSLIFDPWQEFGSSSYFDSSWHITRSCLLMLFGGTLAFFMVLTEYILVSVTSAVTV
TIAGVVKEAVTIVVAVFYFHDKFTWMKGVGLITIMFGVSLFNLYKYDKLQKGNPNEDEISRSSMQNEAAKYVILEELEDQ
DDGP
P166A09 cytochrome P450 sequence similar to At3g14610-90. Four introns predicted downstream of the start codon/upstream of the stop codon. Protein coding sequence shown in bold type.
ATGGAGATTTTGTATAACACAATTATAGCAATAATTTGTGTTGCAATATTGTTGGTATATACATGGAGAGTGTTGAATTG
GGCATGGTTTAGGCCAAAAAAATTGGAGAATTTCTTAAGGCAAAGAGGTCTAAAAGGAAATCCATATAAGTTACTCTATG
GAGATTTGAATGAACTCACAAAAAGTATAGTTGAAGCTAAGTCTAAGTCAATCAATATCTCTGATGATATAACTCAAAGG
CTTATCCCTTTTTTCCTTGACTCCATCAACAAAAATGGTATGTTTATTTTATTGATTCGACTAGAAAGTAAACACTGCAA
CTTTGAGTATGCATGTCTAAACACCTTAACTTTATGTGATTCGTTTATCTAAACTTTATGTGTCACGTACGAGACACGGT
GGAGACAAGTTGGAAGTGTTTAGTTGCTAGTTGGACCAAGTTTAGGAGTCTAGATTTGCACCTCAAAGTTGGAGTGTTTA
CTTGTCAGCTGATATCATATTTGAGTGTTTGTTTATGTAGTATATGCCTTTTTTTATAATTGAAAATGGATTTTTGGCAG
GTAAAAGTTCTTTCATGTGGCTAGGCCCATATCCAACAGTGTTGATCACAAATCCTGAACATGTAAAAGAGATTTTGACA
AAGAATTATGTGTACCTAAAGCAAACTCATCCAAATCCATTTGCAAAGTTATTGGCTCAAGGTCTTGTGTTGGTTGAGGA
AGACAAATGGGCAAAACACAGAAAAATAATCAATCCTGCTTTCCATGTTGAGAAGTTAAAGGTTAAATATACTTCTTTTT
TGTTGTATTGAATTGGGATATGGCACAAGTATCCCCTAGATTATGATCGAAATCTCACAGATACACCTTAACTAATCTAA
GGTCCTATTACTCCATAAACTCATTTTTTGTGTAATTTTGTACAACTTTTGGCTTACGTGACACACTCTGTGACTCCACT
TAAGTGAGGCGCGTGGGAGATGTTTGGAGGTCACGTAGGCCAAAAAAGGTGTACAAAATTACAAAAAAAAAAGTTCAAGG
GTAATAGAACCTCAGTTTAGTTAAGGTGCGTCTCTAAAATTTCGGTCATAGACTATGGTTACTAGTCTCTTATCCCTATT
GAATTTAGGCCAAAAAAAGCAGAAAATTCAATTTTCTTTTTTTTTTTCATTTGTTTTGTACAGCATATGTTGCCAGCATT
TTATATGAGTTGTAGTGAAATGATAAGCAAATGGGAGGATATTGTTTCAAAGGAAACATCATACGAGCTCGATGTATGGC
CAGACCTTCAAATAATGACCAGTGAAGTTATTTCTCGAACCGCATTTGGTAGTAGCTATGAAGAAGGGAGAATAGTGTTT
GAACTTCAGCAAGAACAAGCTGAGCATATAATGGACATAAGTCGTTCAATATATATACCAGGATCGAGGTATGATAATTT
ACTTTTGAGATTTCTACATAATACGGAAACTAAAATGTTCATTACTTAAATTTGTTGTGTTAGGTTCTTGCCTACTAAAA
GGAACAAAAGAATGCTCGAAATCGAAAAGCAAATTCAAACAACGATTAGGCATATCATCGACAAAAGATTGAGGGCAATG
GAAGCAGGGGAGACTAGTAAAGATGATTTATTAGGCATATTACTTGAATCCAATATGAAAGAAATTGAACAACACGGAAA
CAAAGATTTCGGATTGACAACAACAGAAGTGATTGAAGAATGCAAGTTATTCTATTTTGCTGGACAGGAGACCACTTCAG
TGTTGCTCGTGTGGACGATGGTTTTGCTATGCCTACATCCAGAGTGGCAAGTACGGGCCAGAGAGGAGGTTTTACAGGTC
TTCGGAAATGAAAAACCAGATTTGGAAGGACTAAGTCACCTCAAAATTGTAAGTACTTTCCGCTATGTCGTTGGCATAGA
TCAAACTTCAACAATCAAGGAAACTATAAAATCAGGATAAAACAAGTAGCTGTTAATGTGAAATCGTTCCGACTGGGCTC
AGATAGCTAGGCCACTTCTATAATCCTATTTCAGTCTCGGAAGGGCAATTACTATGAGACTAAAATATCTCGCGAAGGCA
TGACCCCTGAATTTTGTAAGAAGTGAACTAATTCTACTTCCAACTTACGCAATGTATTTTTTTTCCATAGGTGACAATGA
TCTTATACGAGACATTAAGGCTATTCCCCCCATTACCGGTATTTAGTAGAAGGAACAAAGAAGAAGTCAAATTAGGGGAG
CTGCAGCTACCAGCTGAAGTGATACTTATTATACCTGCAATCTTTATTCATTATGACAAGGAAATATGGGGCGAAGATGC
GAAGGAATTCAAACCAGAAAGATTCAGTGAAGGAGTGTCAAAGGCAACAAAAGGTCAAGTCTCGTTTATTCCGTTTGGTT
GGGGACCTCGAATTTGCATCGGACAAAACTTTGCAATGATGGAAGCAAAAATGGCAATAGCAATGATACTACAAAAGTTC
TCCTTTGAACTCTCTCCGTCTTATACGCATGCTCCATTTGCAACAATTACTATTCATCCACAGTATGGTGCTCCTCTGCT
TCTGCGCAAACAT
Predicted coding sequence
ATGGAGATTTTGTATAACACAATTATAGCAATAATTTGTGTTGCAATATTGTTGGTATATACATGGAGAGTGTTGAATTG
GGCATGGTTTAGGCCAAAAAAATTGGAGAATTTCTTAAGGCAAAGAGGTCTAAAAGGAAATCCATATAAGTTACTCTATG
GAGATTTGAATGAACTCACAAAAAGTATAGTTGAAGCTAAGTCTAAGTCAATCAATATCTCTGATGATATAACTCAAAGG
CTTATCCCTTTTTTCCTTGACTCCATCAACAAAAATGGTAAAAGTTCTTTCATGTGGCTAGGCCCATATCCAACAGTGTT
GATCACAAATCCTGAACATGTAAAAGAGATTTTGACAAAGAATTATGTGTACCTAAAGCAAACTCATCCAAATCCATTTG
CAAAGTTATTGGCTCAAGGTCTTGTGTTGGTTGAGGAAGACAAATGGGCAAAACACAGAAAAATAATCAATCCTGCTTTC
CATGTTGAGAAGTTAAAGCATATGTTGCCAGCATTTTATATGAGTTGTAGTGAAATGATAAGCAAATGGGAGGATATTGT
TTCAAAGGAAACATCATACGAGCTCGATGTATGGCCAGACCTTCAAATAATGACCAGTGAAGTTATTTCTCGAACCGCAT
TTGGTAGTAGCTATGAAGAAGGGAGAATAGTGTTTGAACTTCAGCAAGAACAAGCTGAGCATATAATGGACATAAGTCGT
TCAATATATATACCAGGATCGAGGTTCTTGCCTACTAAAAGGAACAAAAGAATGCTCGAAATCGAAAAGCAAATTCAAAC
AACGATTAGGCATATCATCGACAAAAGATTGAGGGCAATGGAAGCAGGGGAGACTAGTAAAGATGATTTATTAGGCATAT
TACTTGAATCCAATATGAAAGAAATTGAACAACACGGAAACAAAGATTTCGGATTGACAACAACAGAAGTGATTGAAGAA
TGCAAGTTATTCTATTTTGCTGGACAGGAGACCACTTCAGTGTTGCTCGTGTGGACGATGGTTTTGCTATGCCTACATCC
AGAGTGGCAAGTACGGGCCAGAGAGGAGGTTTTACAGGTCTTCGGAAATGAAAAACCAGATTTGGAAGGACTAAGTCACC
TCAAAATTGTGACAATGATCTTATACGAGACATTAAGGCTATTCCCCCCATTACCGGTATTTAGTAGAAGGAACAAAGAA
GAAGTCAAATTAGGGGAGCTGCAGCTACCAGCTGAAGTGATACTTATTATACCTGCAATCTTTATTCATTATGACAAGGA
AATATGGGGCGAAGATGCGAAGGAATTCAAACCAGAAAGATTCAGTGAAGGAGTGTCAAAGGCAACAAAAGGTCAAGTCT
CGTTTATTCCGTTTGGTTGGGGACCTCGAATTTGCATCGGACAAAACTTTGCAATGATGGAAGCAAAAATGGCAATAGCA
ATGATACTACAAAAGTTCTCCTTTGAACTCTCTCCGTCTTATACGCATGCTCCATTTGCAACAATTACTATTCATCCACA
GTATGGTGCTCCTCTGCTTCTGCGCAAACAT
Predicted protein sequence – 516 amino acids
MEILYNTIIAIICVAILLVYTWRVLNWAWFRPKKLENFLRQRGLKGNPYKLLYGDLNELTKSIVEAKSKSINISDDITQL
IPFFLDSINKNGKSSFMWLGPYPTVLITNPEHVKEILTKNYVYLKQTHPNPFAKLLAQGLVLVEEDKWAKHRKIINPAFH
VEKLKHMLPAFYMSCSEMISKWEDIVSKETSYELDVWPDLQIMTSEVISRTAFGSSYEEGRIVFELQQEQAEHIMDISRS
IYIPGSRFLPTKRNKRMLEIEKQIQTTIRHIIDKRLRAMEAGETSKDDLLGILLESNMKEIEQHGNKDFGLTTTEVIEEC
KLFYFAGQETTSVLLVWTMVLLCLHPEWQVRAREEVLQVFGNEKPDLEGLSHLKIVTMILYETLRLFPPLPVFSRRNKEE
VKLGELQLPAEVILIIPAIFIHYDKEIWGEDAKEFKPERFSEGVSKATKGQVSFIPFGWGPRICIGQNFAMMEAKMAIA
MILQKFSFELSPSYTHAPFATITIHPQYGAPLLLRKH
P023C09 ankyrin protein kinase gene similar to At3g58760. Ten introns predicted downstream of the start codon/upstream of the stop codon. Protein coding sequence shown in bold type. No corresponding SGN unigene.
ATGGAGTCAAAGTCGCAGTCAAGGTTTCCGCTGGGTAGACAATCATCTCTGGCGCCGGAGAAAGACGGCGTTTCCGACGA
CTCAGTTACCGCCGGCCATGGAGTCGATGAAGGTATGGATTCCGGTTTGAGGTTAATGTACATGACTAATGACGGTGATT
TGGAAGGTATGGAGGAACTTTTGGACTCCGGTACCAGTGTGAACTACAGGGATATAGATGGACGGACTGCGTTGCATATT
GCCGCTTGCCAGGGTTACGCTGATGTTGTTGATTTTCTGCTTAAAAATGGCGCTCAGGTGGATTCCATGGATCGTTGGGG
CAGTACGGTATACTTCATTTTTACTCTGTAATTAGATATCACTAACTTGTATATACGTCTAAAAGCTGGTCAAACTAGCA
GCTCAAACGCAGTTTTTGGCTAATGATATTTTGGGAATACTTCCATGCCCTTTCAGCAATCCTGATTCGATAAGTGATTT
ACCAGCATTTTCGTTCCAGTCTAGTATTCAACTTTCCAAACCGTCTTAGACTGTTAGTCATTTGGAAGTGGAATTACAGT
TTTTTTGCTTATATTTAACTCAGGTAATGCCCTATTTTTTGTATAGTTAGGGTGTGTTGGTGCGCAGGAAAATGTGGAAT
TGGGTGCAATGGCCTTGTCTACCTTGTTAAATATTCTTTTGGATAGATTGTGCTCGTTGGTTGAGCTATTAAGAAATGCT
TCTAAGCAAAAATAAGCCAATGTGAAGGTTAATATGACTTGCATGTTATCTTAATAACACCAAAAAAATATTAATTGATG
AAAAATTAGTTTGATATATCACATCAGAGTTTATTTATTTATTTTTAGTTTATTAATATTTGAACTCTTGAAAGCTGTAT
GGGAAAGAGATGTTCCAATTATCTTGGTTTCTAAATGAGAAGAGTGTTTTAACAAATTTAGACAAAGGAGTACGTCTGTT
TCTGGAGAAAATTTATGAATTCTTAATAGTGTTTAATCATTAGTATAGTGATGCTTTGTGAACGGAGTTAGACTCCAAGT
TGTACAGTGATGTCTACAGAGTGGAACATATGTGTGGTTATCTTTGGGTCTATTTTTGGCTTCTCACAGTAATGCAGTGA
AGTGACAAAGTATGATTAAATAGCCTCTTGCAGATGCAATATATTACAAGAATAATGATGTGGTCAAGCTTTTGGAAGTA
CATGGAGCGAAACCTGCGGTATGTCTCGACAACTAGATTGTAGGATCGAAGTGCCCTATGGTAATATGGCATAACCATTT
ACCTTATCTGTTTTACTTTTTACTTTAGGTGGCTCCCATGCATGTAGAAAATGTTCGTGAAATTCCAGAGTATGAAATTG
ATCCAAGAGAACTTGATTTTAGTAATAGTGTAAACATAACAAAGGTAACAACTTATTTCTCTTTGACTTGATAATTATGC
TTATTTGATCATTGCTCACTTTATTCTTTTGTTATTTGTGTTCTGTTATTGCATTAGATGTCTGCTGATTTTTCAGAATG
GGATGCTTGCCTTTGGTAACAAGTATACTGGCATGTTTTTCAAGTTTATTGCCAAGCTCTGTTTCCTCTTTAGTTATCTT
AGTTGATCAACCTGCCACGAATATACAACATATATTTTTGTTTAGGTTTCATTATTTACCCATTCCAAATGTTATTCATC
CATCGCAACATATATGACCTAATTTTGACTAGCTGGGGCATTCAGATGAGAAGGTTTAAAATGATAGTTTGGAAATTTGA
AGACGTGGGATAGCTAGAAGCAAGACGCTAGTTCAACTTTAAGATAACATAAAGTTAAAATTAAAATATATTTACCTTAA
CATTTTGAAGAGGGAAAGTATTTGTGAGGTAGGCTACAGGTAAGTAGATCAAGAATTTGGGGTTGAATGAAGTATCTGCT
GTTATTATTGTATTTGTTTCTGGCAACTGTTTGCTTTAATCCTACCTGTTATTTCTAACTTCTTGTCTGTTGCTATGTAT
CTGGGATAAAAGTAGATGAACTTTCAATACTGCAATATATTTTCATATCATATTAAATGATTGTAGGGTACGTATTGTGT
TGCTCTGTGGCGTGGAACTAAGGTTGCTGTTAAGAAACTTGGTGAAGAATTATTCACCGACGAAGATAAAGTGTGGGTTG
GTCATAGACTATCTGTGATGTTAGAATTTGAACATTCCTCATTTGACAATTCATAAAAAATTACTAAAGACGCTTCTCTT
TGTTTTCTAACTGTTTTTCAGCAAGGCATTTGGGGATGAGCTTGCCTTAGTACAGAAGATACGCCACCCAAATGTAGTCC
AGTTTCTTGGTGCTGTGACACAGAGTAGCCCAATGATGATCGTCACAGAGTATCTGTCTAAGGTACTTCTGATTTAAAAG
AACAACTCACCACTTCCTGGAGTTATCTCCAGAACTTTGCTATGATGTCACAAAATCAAGGACTTATTGTAATTTGAAAT
TATCACAACGTCGAAATCAAGAACGACCATGCATCAAAATAGTATAATTGATGGTTAAGTATCAACAAAGTACTCAATAC
AAGGGCGTTAACGACTTCACAAATCACGCATATTATTTCATCATTGAAGACATGGTTCTGTTTTGTTTGTTGATCAAACG
AAATATTCCCCATTATTTATGTCAATTAAATTCATTAAAGTCGTTGAGAAAGCCTTTGAAGTCCCTGCAGATTTAAAGTA
TACCATTGATTCTGTTCTTATTCAGGGAGATCTTCGTGCATTCTTGAAACGGAAAGGTGCATTAAAGCCAATAATGGCTG
TGAAGTTTGCACTGGATATTGCAAGGTCAGTTACTGGCTGATTTCCTCAAATTTTCACTTGAGAATCTTATTAGTTTTGC
ATGCATGCTGTTCACCTGGTGCTTGAATTTGCCTAAGGTGTCTGTTGATAAGTGGCCCATTACTACAGGAACACCAACTA
CAGTCTCTTCAATTCTATGTACAATTTAGAATTGTAACATTTATTTTGTACCTCTTCATGCATTTGTGTTTTTTCACCAT
TGGGTTATAAATTTTTCAACTTTGTTGATCTCAACAAAGTACTGTGCTGGACTTTGGGGTTCCATAATGATTATATCTTC
ATAGAAAGCATAGTAGTTGCGCAGCTTCATGATCAGTTGCAGAAGAAGCTGTGTACATAAATATGTTGAGAAACCTGAAT
TTATCTTTCTTATAGTTGCGCCTTTATGTCTCATATGGTCATATTTGTATACATTTTGCAGAGGAATAAACTACTTGCAT
GAGAATAAACCTGAAGCAATAATTCATCGAGACCTGGAGCCTGAGTATGTTATTATAGTCTTCCTGACTGTTTACCCGTG
GCCAGTCTCGTGCTTTGTTTGTTCTTTAGTGGCTGAAGCCTGACAAATGTATGGAAAACTTTTAATTTCTGAGTGAAATG
ACAGAAACATATTACGGGATGATTCTGGACTTCTGAAAGTTGCAGATTTTGGACTTAGTAAGCTGATGAAATTTACCAAA
ACTGTCAGGGAAGTTAGACCATTGGCGCGTCAAGAGGATTCATGTGAGTGTATCCCAGCATTTTCCGCGGTTGAAGAAAT
ATATTCACTCTAATGATTTGTTGCTGTTACTTTGTTGTCACTTTTTTGTTACTCTTATATTTATGCAAAGCGTATACGAA
CAATGGCTTTAAGCTCAAGTCTCATGGTTCTACTTTTCCTTTTAATTTTGATGAAGCAAATTTTCACCTCTGTTTCGGTG
TTTCCTTTCTAAGCTTCAGCATATGGTCGTTGAATTTTTTATTTGAAACTGAAAGTGACAAAGTGTTTGTATGGTCCTTG
AATTTTTTTGCCAGCAAATACTAAACCGTTCACGTTTTGACACTTAAATGGTTGTGCTAGTGAATGAAACTCTAGGATTT
GGGATAGGAGTATCTTGATTTTTTTTTGTTCATCAAAAGAACTATTCTCTTGAACATTTGGCAATAGAGTTTGAAGAGGA
GAACTAGAAAGTTATTTTAGAAAAAGAATATGCATAAGTACTGGTTGCCTCAAATTTTAGTTGATAGCACTCCTATTTAA
TCATTGTAGAATTATGGGTCTTTATACGCATGTTTTTAACAAGGAAATTGGTGTGATATTACGTTTTAGTATATGAGAAT
AACAAGTTGAATTGACCTCTTGGTTTACAGGGAGATATGTTGCTCCAGAAGTTCTTAAGCATGAGGAGTATGATACCAAG
GTGGATGTTTTCTCATTTGCTTTGATATTGCAAGAGGTAAGCTCTTCTAATTCTTAAAACTTTTCTCTCATGCATAAGCT
ACTTAAAAAGGATCTCCAGTTGTGCCTGTCTGGAAGAAAAAATGTTAGTTATCACTTCTTGCTTCGTAGATATTTTAAGT
TTTTTACTTTATTTAACTGAACTTTGAGTGTAATGCGTGCTAATGGGCATGATATCAGATTGATAGCCACCAATAGGTTG
GTATGTATGCATTCTAGAGGTCATCTCATGGAGTAAAAAGGCAACGGGGTCCTCCATATTTTGCAGTCGATGTTAGTTGT
TTCTAAAAAGATTGCATTGCCATCTACTGTCTCCTATTCTTATTTCTTGCAAATTTATGCTTATTCTACCTTATTAATTC
ACTCGGAACACCTTGACTGTTCCAGCATGTTTGTAAATCCCTTATTATTTAAGAGGGCCGTCGGGTAATTTAAATATGTA
TACACCTTAATATGCTTTCCGTTCCACAGATGATTGAAGGCTGTCCACCATTTTCCACGAAGCAGGAAATTGAGGTGGCC
AAAGCATATGTTGCAAATGAACGCCCTCCCTTTAAAGCTTCACAAAAGTTATATGCTCATGGATTGAGAAAGTAAGTCCC
TGTGCTTTTTTCGGTTCCCTTTAATAGTATTTAAAGTGATTATTTCAACAGGTTAATTGAGGATTGCTGGAAGGAGCAAC
CATCAAAAAGACCGACTTTTCAGCGAATAATTATCAGGTTGGAAGAAATTAACCGTATTCTTTTGCATAGAAGACGTTGG
AAGGTACAAATCTCTCTCTCCCGACTCCCTTCAGTTCGGTATTTCCAAAGTCTGGTCATATATAATAAATCAAGCTTCGG
TATGGTAAATTCTGCTTCAGTAATTCGG
Predicted coding sequence
ATGGAGTCAAAGTCGCAGTCAAGGTTTCCGCTGGGTAGACAATCATCTCTGGCGCCGGAGAAAGACGGCGTTTCCGACGA
CTCAGTTACCGCCGGCCATGGAGTCGATGAAGGTATGGATTCCGGTTTGAGGTTAATGTACATGACTAATGACGGTGATT
TGGAAGGTATGGAGGAACTTTTGGACTCCGGTACCAGTGTGAACTACAGGGATATAGATGGACGGACTGCGTTGCATATT
GCCGCTTGCCAGGGTTACGCTGATGTTGTTGATTTTCTGCTTAAAAATGGCGCTCAGGTGGATTCCATGGATCGTTGGGG
CAGTACGCCTCTTGCAGATGCAATATATTACAAGAATAATGATGTGGTCAAGCTTTTGGAAGTACATGGAGCGAAACCTG
CGGTGGCTCCCATGCATGTAGAAAATGTTCGTGAAATTCCAGAGTATGAAATTGATCCAAGAGAACTTGATTTTAGTAAT
AGTGTAAACATAACAAAGGGTACGTATTGTGTTGCTCTGTGGCGTGGAACTAAGGTTGCTGTTAAGAAACTTGGTGAAGA
ATTATTCACCGACGAAGATAAAGTGTGGGCATTTGGGGATGAGCTTGCCTTAGTACAGAAGATACGCCACCCAAATGTAG
TCCAGTTTCTTGGTGCTGTGACACAGAGTAGCCCAATGATGATCGTCACAGAGTATCTGTCTAAGGGAGATCTTCGTGCA
TTCTTGAAACGGAAAGGTGCATTAAAGCCAATAATGGCTGTGAAGTTTGCACTGGATATTGCAAGAGGAATAAACTACTT
GCATGAGAATAAACCTGAAGCAATAATTCATCGAGACCTGGAGCCTGAAAACATATTACGGGATGATTCTGGACTTCTGA
AAGTTGCAGATTTTGGACTTAGTAAGCTGATGAAATTTACCAAAACTGTCAGGGAAGTTAGACCATTGGCGCGTCAAGAG
GATTCATGGAGATATGTTGCTCCAGAAGTTCTTAAGCATGAGGAGTATGATACCAAGGTGGATGTTTTCTCATTTGCTTT
GATATTGCAAGAGATGATTGAAGGCTGTCCACCATTTTCCACGAAGCAGGAAATTGAGGTGGCCAAAGCATATGTTGCAA
ATGAACGCCCTCCCTTTAAAGCTTCACAAAAGTTATATGCTCATGGATTGAGAAAGTTAATTGAGGATTGCTGGAAGGAG
CAACCATCAAAAAGACCGACTTTTCAGCGAATAATTATCAGGTTGGAAGAAATTAACCGTATTCTTTTGCATAGAAGACG
TTGGAAGGTACAAATCTCTCTCTCCCGACTCCCTTCAGTTCGGTATTTCCAAAGTCTGGTCATATATAATAAATCAAGCT
TCGGTATGGTAAATTCTGCTTCAGTAATTCGG
Predicted protein sequence – 464 amino acids
MESKSQSRFPLGRQSSLAPEKDGVSDDSVTAGHGVDEGMDSGLRLMYMTNDGDLEGMEELLDSGTSVNYRDIDGRTALHI
AACQGYADVVDFLLKNGAQVDSMDRWGSTPLADAIYYKNNDVVKLLEVHGAKPAVAPMHVENVREIPEYEIDPRELDFSN
SVNITKGTYCVALWRGTKVAVKKLGEELFTDEDKVWAFGDELALVQKIRHPNVVQFLGAVTQSSPMMIVTEYLSKGDLRA
FLKRKGALKPIMAVKFALDIARGINYLHENKPEAIIHRDLEPENILRDDSGLLKVADFGLSKLMKFTKTVREVRPLARQE
DSWRYVAPEVLKHEEYDTKVDVFSFALILQEMIEGCPPFSTKQEIEVAKAYVANERPPFKASQKLYAHGLRKLIEDCWKE
QPSKRPTFQRIIIRLEEINRILLHRRRWKVQISLSRLPSVRYFQSLVIYNKSSFGMVNSASVIR