日本語標準アクセントの本態はピッチ(声の高さ、声の基本周波数)の有意的な下降である。
(発話は常に多かれ少なかれ経時的に自然なピッチの下降を伴うが、それは話者にも聴者にも何ら意味を持たない生理的現象である。これに対してアクセントによる下降は生理的に自然で無意味な範囲を超えた程度に及び、聴取においても有意的に捉えられる。)
有意的下降は原則として語中に零ヶ所または一ヶ所現れ、その位置は拍と拍の境目であり、原則として拍内部では下降しない。従って語のアクセントは拍を単位として例えばHHHLLや●●●○○のように二種の高さによって表すことができる※1。この場合、3拍目と4拍目の間にアクセントの「タキ(滝)」があると言い、3拍目をアクセントの「核」と言う。
ところでこのHHHLLや●●●○○の表記には余剰性(冗長性)がある。各拍の高さを表示しなくてもタキや核の位置さえ明示できればこの語のアクセントの表記は完結する。例えば○○○\○○でも良いし、単に「3」でも良い。従って音韻論的アクセント表記は今示したような簡潔なものとなる。
ここで注意しなければならないのは、実際の発話では文頭の語及びプロミネンス(強調、卓立)の付加された語は語頭にピッチの上昇を伴うということである。つまり例に挙げた語でいえば、LHHLLや○●●○○として実現されるわけである。(もちろん文中においてプロミネンスが付かない場合はHHHLL、●●●○○である。)このため市販のアクセント辞典では学習者の便宜を考えて●●●○○のように一拍目を低く表示してあるが、実は、常に一拍目が低いわけではないし、それが本質でもないということに留意しなければならない※。
※ 現在一部のアクセント辞典で一拍目を低く表示しない方式が採用されている。