Different Approaches to the Semantics of Comparison
Arnim von Stechow
1.Basic notions of syntax and semantics......
1.1.Forms of comparison......
1.2.Syntax for the examples......
1.3.Semantics......
1.4.Licensing of NPIs......
2.Adjectival Polarity and Duality Relations......
2.1.Properties of polar adjectives......
2.2.Semantics of antonyms......
2.3.Little and Less......
3.Quantifikation über Grade, Differenzialphrasen, Polare Anomalie......
4.Positiv (und Negativ)......
5.Modals in comparatives......
5.1.Modals and intensional semantics......
5.2.Modals in comparative complements......
5.3.Less comparatives under modals......
5.3.1.Data......
5.3.2.Ambiguity of less as a scope ambiguity......
5.4.Exklamative......
5.5.Konsekutivsätze......
6.Schwarzschild......
6.1.(Schwarzschild, 2004a)
6.1.1.Maßphrasen......
6.1.2.Differenzialkomparativ......
6.2.(Schwarzschild, 2004b)
6.2.1.Quantoren im Komplement......
6.2.2.Modale in Komparativen......
7.Aufgaben......
8.Lösungen der Aufgaben......
Literatur......
Note: This material is taken mostly from handouts from talks given by Irene Heim. Irene kindly permitted me to use the material. In addition I have used material from lectures given by Cecile Meier at the ESSLI summer school 2002.
1.Basic notions of syntax and semantics
1.1.Forms of comparison
(
(1)Comparative
a. John is taller than Mary is (inequality)
b. Mary is less tall than John is (negative inequality)
c. Bertha is as tall as Martha is (equality)
(2)a. "The degree to which John is tall is greater than the degree to which Mary is tall.”
b. “The degree to which Mary is tall is smaller than the degree to which John is tall.”
c. “The degree to which Bertha is tall is at least as great as the degree to which Martha is tall.”
(4) Positive
(3)a.“The height of John is greater than the height of Mary.”
b.“The height of Mary is smaller than the height of John.”
(4)Positive
a. The Woolworth Building is tall.
b. The degree to which the Woolworth Building is tall is greater than the contextually salient standard for tallness of buildings.
(5)Measure phrases and differentials
a. The Woolworth Building is 767 feet tall.
b. The Empire State Building is 2 feet taller than the Chrysler Building.
c. The Sears tower is twice as tall as the Woolworth Building.
( 6)a. “The degree to which the Woolworth Building is tall equals 767 feet.”
b. “The degree to which the Empire State Building is tall equals the degree to which the Chrysler Building is tall plus 2 feet.”
c. “The degree to which the Sears Tower is tall equals the degree to which the Woolworth Building is tall times 2.”
1.2.Syntax for the examples
The syntax has not changed since (Bresnan, 1973).
( 7)Subdeletion is the basic case. Everything else is ellipsis and assumed to look like subdeletion at LF.
(8)The knife is longer than the drawer is deep.
(9)DS: John is er [than Mary is what-tall]-tall
SS: John is er [than what2 Mary is t2-tall]-tall
PF:John is tall-er [than what1 Mary is t1-tall]Subdeletion, extraposition
John is tall-er [than what1 Mary ist1-tall]Comparative deletion, extraposition
LF:[-er[what2 Mary is t2-tall]]1 John is t1-tallObtained from LF by QR-ing the er-Phrase and by wh-movement within that Phrase
( 10)Comparative construction: DS
.
( 11)Comparative construction: SS (without extraposition and –er-movement)
( 12)than-clause is a wh-clause with a degree gap. Degree-gap is trace of an empty operator interpreted as a -abstractor.
( 13)-er and than-clause form a constituent at LF. (Than-clause is obligatorily extraposed at PF and -er is affixed to the adjective or supported by dummy much.)
( 14)-er + than-clause is moved to a clausal scope at LF and leaves behind a degree variable.
1.3.Semantics
( 15)Types
e is the type of individuals, t is the type of truth values, d is the type of degrees.
If and are types, () is at type. (Outermost brackets are omitted.)
( 16)Semantic domains
a.De, Dt, Dd are the sets of individuals, truth values, and degrees respectively.
b.D = the set of functions with arguments in D and values in D.
Ontology
Given: various sets of "degrees" of different sorts, all disjoint from each other, and each with its unique intrinsic order: E.g.:
( 17)SD := the set of all spatial distances
SD := {<x,y> SD SD: x is a greater spatial distance than y}
( 18)TD := the set of all temporal distances
TD := {<x,y> TD TD: x is a greater temporal distance than y}
( 19)Call each such pair (X, >X) a scale.
Properties of orders: >X is total on X, asymmetric, transitive, irreflexive.
For our convenience in using the metalanguage, we can name the elements of SD and TD with measure phrases ('63 centimeters', '3 months'), but this implies no commitment about the actual semantic analysis of measure phrases in natural language. (More on this below.)
( 20)Dd := SD TD .... the set of all "degrees" of all sorts
> := >SDTD....
Note: no well-defined order between pairs of degrees of different sorts. > is not total on Dd. It is, however, still asymmetric, transitive, and irreflexive (due to the disjointness of the scales).
The traditional Seuren/Stechow semantics:
Gradable adjectives are relations between individuals and degrees.
( 21)Measure functions (type ed)
TALL = x De.x’s height
INTELLIGENT = x De.x’s intelligence
HEAVY = x De.x’s weight
Measure functions assign a unique degree to individuals. TALL(x) is the maximal degree to which x is tall etc. Adjectives relate individuals with sets of degrees:
( 22)Degree adjectives
[[tall]] = d Dd.x De. TALL(x) ≥ d
[[intelligent]] = d Dd.x De. INTELLIGENT(x) ≥ d
More accurately, the degrees of adjectives must be restricted to particular sorts: [[tall]] is restricted to spatial distances measured in the vertical dimension. This will be done if needed.
( 23)Comparative morpheme
[[ -er]] = P Ddt.Q Ddt.P Q
Equivalent formulations:
( 24)a.[[ -er]] = P Ddt.Q Ddt.d Dd[P(d) = 1 Q(d) = 1] & d[Q(d) = 1 & P(d) = 0]
b.[[ -er]] = P Ddt.Q Ddt.the maximal d s.t. P(d) = 1 > the maximal d s.t. Q(d) = 1.
Formulation ( 24a) is Kennedy’s, ( 24b) is almost Stechow’s (1984b). Stechow’s analysis is slightly more complicated, because he treats differential comparatives, which are not expressible in the semantics given here.
( 25)Proto LF (QR the comparative DegP and wh-move what)
.
..
Chomsky’s Principle of Full Interpretation (PFI) says that we delete the semantically uninterpretable material at LF, i.e. than, what and is.
( 26)Transparent LF (satisfies PFI)
.
( 27)Interpretation
Exercise.
Give an analysis of the equative in the sentence
( 28)Alla is as friendly as Sveta is.
Hint: Analyse the first as in analogy to the comparative suffix –er. Analyse the second as as a semantically empty complementizer.
A.Give an interpretation for the equative as.
B.Give the precise LF for sentence ( 28).
C.Give a precise calculation of the truth condition of your LF.
1.4.Licensing of NPIs
NPIs are licensed in downward entailing (DE) contexts; cf. (Ladusaw, 1979).
(29)An expression f is DE, if for any set M and N: if f(M) is true and N M, then f(N) is true.
(30)-er is DE w.r.t. to first argument: suppose -er(D)(P) is true and D’ D.
Then -er(D’)(P) is true.
Obvious from definition ( 23).
( 31)a.Max is smarter than anyone else.
b.Max is [er than wh1x[x≠ Max & x is t1-smart]]-smart
= {d | x[x ≠ Max & x is d-smart]} {d | Max is d-smart}
Recall that Ladusaw interprets NPIs as existential quantifiers. The meaning correctly predicts that Max is smarter than any other person.
Erläuterung:
Die Komparativsemantik sagt, dass er(D)(P) gilt, falls D eine echte Teilmenge von P ist. Falls D’ eine Teilmenge von D ist, gilt D’ P erst recht. Damit sind NPIs in der Umgebung D lizensiert.
( 32)a.John is taller than anyone of his friends.
b.Mir geht es besser als jemals zuvor.
c.Fritz hat mehr Aufgaben gemacht, als er zu machen brauchte.
NPIs im Äquativkomplement?
( 33)a.Max does as well as ever before.
b.*Mir geht es so gut wie jemals zuvor.
c.You are as well know as anyone.(Free Choice?)
NPIs are interpreted within their CP. No long scoping is necessary.
Quantoren im Komparativkomplement, die keine NPIs sind, liefern die falsche Lesart, falls sie in situ bleiben.
( 34)a.Max is taller than everyone else.
b.Max is [er than wh1x[x≠ Max x is t1-tall]]-tall
{d |x[x≠ Max x is d-tall]} {d | Max is d-tall}
Wrong prediction. This means that Max is taller than the smallest person different from him.
(35)Long QR:
x[x≠ Max Max is [er than wh1 x is t1-tall]]-tall
x[x≠ Max {d | x is d-tall} {d | Max is d-tall}]
Correct prediction. But we have to scope everyone else out of its finite clause, violating an island.
Ebenso:
(36)Max ist größer als einer meiner Freunde. (Weiter Skopus!)
Max ist größer als zwei/die meisten meiner Freunde. (Weiter Skopus!)
(37)Äquativ
Wie Komparativ, mit als Bedeutung.
(38)Hans ist so groß wie Maria.
DS: Hans so [wie Maria wh1-groß ist]-groß ist
LF: so [wie wh1 Maria t1-groß ist] 2 Hans t2-groß ist
{d : TALL(Maria) ≥ d} {d : TALL(Hans) ≥ d}
Korrekte Vorhersage: (39a)/(39a’) und (39b)/(39b’) sind paarweise äquivalent.
(39)a.Hans ist nicht so groß wie Maria.
a’.Maria ist größer als Hans.
b.Hans ist nicht größer als Maria.
b’.Maria ist so groß wie Hans.
(40)Weitere Daten zum Äquativ
a.Maria ist so schön wie niemand sonst.
b.?Maria ist so schön wie jeder von uns.
c.?Maria ist mindestens/genau so/ höchstens so schön wie jeder von uns.
d.*Maria is mindestens/genau so/höchstens so schön wie niemand sonst.
Probleme, die wir bisher mit dieser Semantik gesehen haben:
- Lizensierung von NPIs unter Äquativ vorher gesagt; empirisch (zumindest im Deutschen) falsch.
- Für negative Terme unter Äquativ wird die falsche Bedeutung vorher gesagt.
- Quantoren im Komparativkomplement oder Äquativkomplement müssen QR-t werden, und zwar lang.
Die Quantorenproblematik wird weiter unten aufgenommen. Zunächst mehr Stoff.
2.Adjectival Polarity and Duality Relations
2.1.Properties of polar adjectives
(41)Converses
a.John is taller than Mary.
b.Mary is shorter than John.
The two mean the same. This must follow from the semantics of polarity plus the comparative.
(42)a.Max is as old as Ede is.
b.Max is not younger than Ede is.
c.Max is older than Ede or he has the same age as Ede.
(42b) follows from (42a), (42c) means the same as (42a).
(43)Cross-polar anomaly
a.John is 1.80 m tall.
b.*John is 1.80 m short.
c.*Alice is taller than Carmen is short.
Cf. (Stechow, 1984a), (Bierwisch, 1987), (Kennedy, 2001)
(44)Less comparatives
a.Ede is less tall than Alla.
b.Ede is shorter than Alla.
2.2.Semantics of antonyms
Main idea: the negative pole of an antonym pair is treated as the negation of the positive pole. The account is very similar to that in (Stechow, 1984a) and (Kennedy, 2001). But the elegant formulation in terms of negation is due to Irene Heim.
(45)Refinement of lexical entries: adjectives are relations that are restricted to certain sorts of degrees.
( 46)Amended entry for tall:
[[tall]] = d: d SD. x. TALL(x) ≥ d, where SD is the set of spatial distances (e.g. a proper subset of Dd)
i.e., [[tall]]‚ is undefined (rather than false) for degrees that are not heights.
(47)John is taller than Mary.
{d DS | TALL(m) ≥ d} {d DS | TALL(j) ≥ d}
(48)Polarity
[[short]] = d: d SD.x.[[tall]](d)(x) = d: d SD. x. TALL(x) ≥ d
[[slow]] = d: d VD.x.[[fast]](d)(x) = d: d VD. x. FAST(x) ≥ d, where VD is the set of velocity degrees
[[light]] = d: d MD. x.[[heavy]](d)(x) = d: d MD. x. HEAVY(x) ≥ d, where MD is the set of mass degrees
Wir haben es mit interner Negation zu tun, d.h. wir müssen das Komplement bezüglich der adjektivspezifischen Gradsorte bilden. Bei Adjektiven mit nach oben unbeschränkter Skala, d.h. den üblichen, ergibt das Komplement bezüglich eines Grades den Teil der Skala, der von diesem Grad bis ins Unendliche reicht.
( 49)d-groß (hans) : ------>d]
d-groß(hans): d[------>∞
We first deduce some facts about converses.
(50)John is taller than Mary Mary is shorter than John.
{d SD | TALL(m) ≥ d } {d DS | TALL(j) ≥ d}
iff {d SD | TALL(j) ≥ d} {d DS | TALL(m) ≥ d}(set theoretical law)
The set theoretical law used is this:
(51)Let A and B be subsets of U. Then
a.A B iff U – B U – A.
b.A B iff U – B U – A.
(52)John is not as smart as Mary Mary is smarter than John
(53)Law of Comparability
Let M be a measure function from De into S, S a subset of Dd.
Then for any x, y De: M(x) > M(y) or M(x) = M(y) or M(x) < M(y).
Equivalently:
Then for any x, y De: {d S | M(x) ≥ d } or {d S | M(x) ≥ d }.
(54)Equative
[[ as]] = P.Q.P Q
(55)John is not as smart as Mary
iff {d IQ | SMART(m) ≥ d} {d IQ | SMART(j) ≥ d}
iff {d IQ | SMART(j) ≥ d} {d IQ | SMART(m) ≥ d}(by Comparability)
iff Mary is smarter than John
2.3.Little and Less
(56)a.Mary is less tall than John.
b.Mary is shorter than John.
The synonymy of less tall and shorter follows from Heim’s treatment of little as DegP negation. Cf. (Heim and Kennedy, 2002).[1]
(57)little takes a degree-argument and forms a generalized quantifier over degrees.
(type d(dt,t))(H & K, 83)
[[little]] = d.Pdt. P(d) = 0.
Intuitively: 'd-little' means 'not d' or 'not to degree d' (cf. 'not John': Pet. P(j) = 0)
(58)LF for 'Mary is less tall than John':
[-er than wh1[[t1little]3J is t3tall]]2[[t2little]4M is t4tall]
Heim comments: "The comparative quantifier is [-er than CP]. little is left behind inside the clause over which the comparative quantifier takes scope. Because little is left behind in the matrix clause, we expect a matching little in the elliptical 'than'-clause. t little itself is also a degree-quantifier, so this too needs to take scope at an interpretable position. (The required movement may be very short – just enough for interpretability. In the example, I have moved to the edge of the minimal clause, but there may be lower possible landing sites.)”
(59)Interpretation:
[[3 John is t3 tall]] = {d: TALL(j) ≥ d}
[[t1 little]]g = Pdt.P(g(1)) = 0
[[t1 little 3 John is t3 tall]]g = 1 iff ¬TALL(j) ≥ g(1)
[[wh1[t1 little]3 John is t3 tall]] = {d: ¬TALL(j) ≥ d)}
by analogous calculation:
[[2 [t2 little]4 Mary is t4 tall]] = {d: ¬TALL(m) ≥ d}
using entry for -er, the complete structure is true iff
{d: ¬TALL(j) ≥ d} {d: ¬TALL(m) ≥ d}
equivalently, {d: TALL(m) ≥ d} {d: TALL(j) ≥ d},
i.e., Mary is shorter than John
(60)Maria ist weniger groß als Franz.
(61)DS
Daraus wird die LF durch folgende Schritte abgeleitet:
- Komparativbewegung: QR des Komparativkomplements
- interne Bewegung der DegP d-wenig: Da es sich bei d-wenig um einen Gradquantor handelt, muss er aus Typengründen bewegt werden. Diese Bewegung kann sehr kurz sein.
- Bewegung im Komparativkomplement: wie immer wird das Gradargument des Adjektivs im Komparativkomplement bewegt und als -Operator gedeutet.
(62)LF:
(63)Interpretation:
Correct predictions for examples problematic for (Rullmann, 1995)? [2]:
(64)John is less tall than any of the girls.
a.[-er than wh1[[t1little]3any of the girls are t3tall]]2[[t2little]4J is t4tall]
{d |x[girl(x) & TALL(x) ≥ d]} {d | TALL(j) ≥ d}
equivalently: {d | TALL(j) ≥ d} {d | x[girl(x) & TALL(x) ≥ d]}
'he is shorter than the tallest girl'
This reading has to be blocked!
b.[-er than wh1[[any of the girls]4 [t1little]3 t4 are t3tall]]2[[t2little]4J is t4tall]
{d |x[girl(x) & TALL(x) ≥ d]} {d | TALL(j) ≥ d}
iff
{d |x[girl(x) TALL(x) ≥ d]} {d | TALL(j) ≥ d}
equivalently: {d | TALL(j) ≥ d} {d | x[girl(x) TALL(x) ≥ d]}
'he is shorter than the shortest girl'
correct reading
We have to say that the negation in the DE-context somehow blocks the licensing of the NPI. Or that [t little] must not be moved across a negation.
3.Quantifikation über Grade, Differenzialphrasen, Polare Anomalie
(65)a.Ede ist mindestens/genau/höchstens 1,70 m groß.
b.#Ede ist mindestens/genau/höchstens 1,70 m klein
(66)Ede ist um mindestens/genau/höchstens 5 cm größer/kleiner als Caroline.
(67)a.Ede ist größer als 1,70 m.
b.Ede ist kleiner als 1,70 m.
(68)Der Eiffelturm ist zweimal so hoch wie der Kölner Dom.
(69)Der Kölner Dom ist halb so hoch wie der Eiffelturm.
(70)*Der Eiffelturm ist doppelt so niedrig wie der Kölner Dom.
Wie (Hellan) und (Stechow, 1984b) mehrfach betonen ist besonders der Differenzialkomparativ bzw. –äquativ problematisch für die meisten Komparativtheorien. Jede Theorie muss ein explizites Quantifizieren über Grade erlauben.
(71)LF für (73)
(72)Gradquantoren
haben den Typ d((dt)t).
a.[[mindestens]] (d)(D) gdw. MAX(D) ≥ d.
b.[[genau]] (d)(D) gdw. MAX(D) = d.
c.[[höchsten]] (d)(D) gdw. MAX(D) ≤ d.
Man denke daran: MAX(d.Ede d-groß) = MAX(d.HEIGTH(Ede) ≥ d) = HEIGHT(Ede).
Die LF bedeutet als HEIGHT(Ede) ≥ 1,70m bzw. HEIGHT(Ede) = 1,70 m bzw. HEIGTH(Ede) ≤ 1,70 m.
Vorhersage: Da MAX(d.Ede d-klein) nicht definiert ist, wird die Ungrammatikalität des folgenden Satzes korrekt vorher gesagt:
(73)#Ede ist mindestens 1,70 m klein.
Man hat hiermit eine Vorhersage für den polar anomalen Satz
(74)#Ede ist 1.70 klein.
Wir müssen lediglich annehmen, dass die LF einen unsichtbaren Gradquantor enthält, z.B. MINDESTENS.
Für die Analyse des Differenzialkomparativs müssen wir uns überlegen, wie wir die Differenzialphrase „um 5 cm“ formalisieren können. Wir könnten versuchen, sie als Modifikator zu formulieren, der aus dem semantischen Komparativ „-er“ den Differenzialkomparativ „um 5 cm –er“ macht. Ebenso könnte die Differenzialphrase „2 mal“ oder „doppelt“ aus dem Äquativ „so wie“ den Differenzialäquativ „doppelt so wie“ machen. Abgesehen davon, dass man nicht recht sieht, wie man dies Modifikatoren definieren soll, empfiehlt sich dieses Vorgehen nicht, denn das Französische wählt für unsere Äquativmodifikatoren den Komparativ:
(75)A cette époque le chateau est cinq fois plus grand que ce qu'il est aujourd'hui. (Google)
Es ist sicherer, anzunehmen, dass das Komparativmorphem ein uninterpretierbares Merkmal [*er] hat, welches ein interpretierbares Merkmal [er] verlangt, das im Kopf einer geeigneten funktionalen Projektion steht, z.B. gerade der Differenzialphrase. Als LF für die Sätze (66) setzen wir somit an:
(76)
Beachte, dass „größer“ dasselbe bedeutet wie „groß“. Die LF ist noch ein wenig komplizierter, da an die Argumentposition von „um“ der Quantor „mindesten 5 cm“ hinein quantifiziert wird.
Für die Semantik der Differenzialpräposition „um“ müssen wir uns überlegen, dass wir zwei Fälle betrachten müssen:
um(5 cm)(d.Caroline d-groß)(d.Ede d-groß) gdw. HEIGHT(Ede) > HEIGHT(Car.)
um(5 cm)(d.Caroline d-klein)(d.Ede d-klein) gdw. HEIGHT(Ede) < HEIGHT(Car.)
Für den Fall, dass die Adjektive in Haupt- und Nebensatz eine verschieden Polarität haben, wollen wir annehmen, dass die Relation „um 5 cm“ nicht definiert ist. Man beachte, dass für ein positives Adjektiv D MAX(D) definiert ist und für das Beispiel gerade die Größe des Subjekts liefert. Für ein negativ polares Adjektiv D ist nur MIN(D) definiert. Für diesen Fall muss dann auch noch die Relation > in < umgedreht werden.
(77)Polaritäten
Sein D ein dichtes Intervall von Graden.
D ist positiv polar – D+ – gdw. D hat ein Minimum und ein Maximum.
D ist negativ polar D- – gdw. D hat ein Minimum aber kein Maximum.
(78)Differential-Phrasen
[[um]] = d.D’.D.D und D’ haben dieselbe Polarität:
MAX(D) – MAX(D’) = d, falls D und D’ positiv sind,
MIN(D’) – MIN(D) = d, falls D und D’ negativ sind.
Man rechnete nach, dass wir die korrekten Wahrheitsbedingungen erhält. Zugleich können wir viele Fälle von „polarer Anomalie“ herleiten; vgl. (Kennedy, 2001).
( 79)a.#Ede ist um 5 cm größer als Caroline klein ist.
b.#Caroline ist um 5 cm kleiner als Ede groß ist.
(Bierwisch, 1987) hält (b) für gut und nimmt dies sogar als die zugrunde liegende Form an. Es ist kein Problem, die Definition für „um“ so anzureichern, dass auch dieser Fall einbezogen wird.
Den normalen Komparativ müssen wir jetzt auch ein wenig nach der neuen Methode umschreiben:
(80)Polaritätssentiver Komparativ
[[ ER[er]]] = D’.D. D und D’ haben dieselbe Polarität:
MAX(D) > MAX(D’), falls D und D’ positiv sind,
MIN(D’) < MIN(D), falls D und D’ negativ sind.
Wiederum lizensiert der semantische Komparativ das uninterpretierbare Merkmal [*er] am Adjektiv. Hier sind Beispiele:
( 81)Der Kölner Dom ist größer als Ede.
ER[er] (d. Ede d-groß) (d.der Kölner Dom d-größer[*er])
Die Methode lässt sich nun auf die Beispiele (67) anwenden:
(82)Ede ist größer als 1,70 m.
ER[er] (1,70 m)(d.Ede d-größer[*er])
(83)Ede ist kleiner als 1,70 m.
ER[er] (1,70 m)(d.Ede d-kleiner[*er])
(84)Polaritätssentiver Komparativ mit Gradobjekt
[[ ER[er]]] = d.D.MAX(D) > d, falls D positiv ist,
MIN(D’) < d, falls D negativ ist.
Man rechne nach, dass die Wahrheitsbedingungen korrekt sind.
Aufgaben:
1.Man gebe die LF für die folgenden Sätze an:
(85)a.Der Mercedes ist um 200 kg schwerer als der Lada schwerer als der VW ist.
b.Der Mercedes ist um 200 kg schwerer als der VW leichter als der Lada ist.
c.Der VW ist um 100 kg leichter als der Mercedes schwerer als der Lada ist.
Welche von diesen bedeuten Dasselbe?
2.Formulieren sie die semantischen Regeln für die entsprechenden Beispiele der Äquativkonstruktionen.
4.Positiv (und Negativ)
Die Standards für positive Größe sind hochgradig kontextabhängig können sich sogar innerhalb eines Satzes ändern. Ein klassisches Beispiel geht auf (Cresswell, 1976) zurück.